Tavily / Exa / Serper / API Pick 比較:LLM 用の Web 検索 API はどれを選ぶ?

Tavily / Exa / Serper / API Pick はどれも「LLM 用の検索レイヤー」を名乗るが、出力形式・フィルター・課金方式は意外と違う。現場視点での横並び比較。
要点
- •ホスト型 RAG で LLM 用回答ブロブを直接欲しい → Tavily(ただし不透明な順位付けと月額下限)。
- •ニューラル / 類似度発見が中心、鮮度はそこそこ → Exa(規模が大きいと予算注意)。
- •生の Google SERP を自分で整形 → Serper。
- •整形済み JSON、呼び出し単位の透明な課金、country / date フィルター、HTTP 200 のみ課金 → API Pick Web Search。
「LLM 用の Web 検索 API」とは何か
汎用検索 API(Google Custom Search、Bing Web Search、SerpAPI)は SERP(検索結果ページ)— 人間がブラウザで見るような青リンクとリッチスニペットの塊 — を返す。これは言語モデルに不向きだ。エージェントが欲しいのは、SERP のパースではなく、整形された ranked リスト:タイトル、URL、コンテキストにそのまま入れられるクリーンなテキスト。本記事の 4 社はすべてこの方向を目指すが、アプローチが違う。
5 つの実用軸で比較する:出力形式、フィルター、課金モデル、統合の手触り、そして「やらないこと」。
4 社をひとことずつ
Tavily
ホスト型 RAG サービス。tavily.search は ranked スニペットを返し、tavily.qna は検索と軽量 LLM 回答をひとまとめにする。 「モデルに即答えブロブを渡す」チャットアシスタントに最適。サブスク + credit。
Exa(旧 Metaphor)
ニューラル / 意味インデックス中心。「この URL に似た URL を見つける」、embedding ランキングを軸に、highlights や本文取得を選択可能。鮮度より類似度が重要なときに最強。サブスク + 超過 credit。
Serper
生の Google SERP API。本物の Google 検索結果ページの JSON 構造(organic、knowledge graph、places、videos)をそのまま返す。スニペット整形とランキングは自分で。1 回は安いが、LLM 用整形レイヤーは自作になる。
API Pick Web Search
従量課金、LLM tool calling 向けに整形済みの意味検索。POST /api/search/web はデフォルトで 5 件(最大 10)の ranked 結果:title、URL、クリーン化された LLM 向け snippet、オプションで country_code と start_date / end_date フィルター。1 回 15 credits(≈ $0.015)、成功時のみ課金。
横並び比較表
| Tavily | Exa | Serper | API Pick | |
|---|---|---|---|---|
| 出力形式 | ranked スニペット + 任意の LLM 回答 | ranked URL + 任意の highlights / 本文 | 生の Google SERP JSON | ranked title + URL + LLM 向け snippet |
| 国フィルター | あり | 限定的 | あり | あり(country_code) |
| 日付フィルター | あり | あり | あり(qdr) | あり(start_date / end_date) |
| Tool schema エンドポイント | — | — | — | あり — GET /api/search/web/tool-schema |
| 課金モデル | サブスク + credit | サブスク + credit | クエリ単価 | 従量課金 credit、$5 / 5,000 |
| 失敗時の課金 | プラン依存 | プラン依存 | 課金 | なし — HTTP 200 のみ |
| 最適用途 | ホスト RAG / チャット | 意味発見 / 類似度 | 自前 SERP パイプライン | AI エージェントツール、RAG |
出力形式:最重要ポイント
このカテゴリーが存在する理由は、LLM が SERP HTML を効率よく推論できないから。LLM が必要とするのは短く、命名された ranked テキスト。だから「snippet がどれだけクリーンか」が、検索 API がエージェントツールとして使えるかの最強の単一指標になる。
Tavily と API Pick は積極的に snippet を整形する。Exa はフラグ次第で highlights か contents を返す — 良いが、量を自分で決める必要がある。Serper は生 SERP を渡し、別途エクストラクタを噛ますことを前提とする。すでにエクストラクタを運用しているならよいが、そうでなければ隠れたコストになる。
API Pick の典型的なレスポンス:
{
"results": [
{
"title": "Retrieval-augmented generation - Wikipedia",
"url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"snippet": "Retrieval-augmented generation (RAG) is a technique that combines\nsearch with text generation, often using vector search to ground LLM\nanswers in retrieved documents."
}
/* …more */
],
"result_count": 5,
"credits_used": 15,
"remaining_credits": 985
}この形式は二次パースなしに function calling のツール結果としてモデルに返せる。
フィルター:国と鮮度
本番エージェントは 2 つのフィルター軸を気にする:
- 国 / 地域:英国の金融エージェントがデフォルトで米国ソースばかり返してはいけない。
- 日付範囲:「今週何があったか」を聞く市場リサーチエージェントは 1 週間前のものを弾けないと困る。
4 社とも対応するが、表現力が異なる。API Pick は ISO 日付文字列(start_date="2026-04-01")で曖昧さがなく、Google の qdr(過去 1 時間 / 1 日 / 1 週 / 1 月)より細かい。
課金モデル:サブスク vs 従量
サブスク型(Tavily、Exa)はトラフィックが安定しているときには合うが、以下では使いにくい:
- プロトタイピングで月額に縛られたくない。
- トラフィックがバースト的(バッチで走るリサーチエージェント等)。
- 部分失敗を積極的にリトライするエージェント設計。
API Pick は credit モデル — $5 で 5,000 credits、Web Search は 1 回 15 credits、credit に有効期限なし、HTTP 200 のみ課金。これは見た目以上に重要:偶発的な 502 で 5 回リトライしても無料、5× ではない。
統合の手触り
最も摩擦の少ない統合は「JSON ツール定義を貼って終わり」。API Pick は既製品を提供:
# OpenAI function tool 定義
curl https://www.apipick.com/api/search/web/tool-schema
# OpenAI tool + Claude tool use の両方が含まれるOpenAI Assistants 統合:
from openai import OpenAI
import requests
client = OpenAI()
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
assistant = client.beta.assistants.create(
name="Research Agent",
model="gpt-4o",
tools=[{"type": "function", "function": schema["openai"]}],
)Claude tool use:
import anthropic
import requests
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
tools=[schema["claude"]],
messages=[{"role": "user", "content": "今週の RAG 研究の新展開は?"}],
)4 社ともやらないこと
どの Web 検索 API も「このドメインの 2019 年以降のすべての X」を確実には返せない。深いアーカイブのカバレッジには検索 + 専用クローラかドメイン特化データセットの組み合わせが必要だ。重複近似の URL も完璧に除去できない。情報源の鮮度や権威性も自分のエージェントで判断するしかない。
クイック選択
よくある質問
1 回あたりの最安はどれ?
課金モデルが違うので単純比較できない。API Pick Web Search は 1 回 15 credits($5 / 5,000 credits 換算で約 $0.015)、HTTP 200 のみ課金。Tavily と Exa は月額サブスク + 超過分 credit、Serper はクエリ単位。トラフィックがバースト的、または失敗時にリトライするエージェントなら「成功時のみ課金」が実費で勝つことが多い。
OpenAI function calling と Claude tool use のどちらでも使える?
全社対応。すべて JSON in / JSON out なのでツール関数化できる。API Pick はさらに tool schema エンドポイント(GET /api/search/web/tool-schema)を提供しており、貼り付けるだけの OpenAI / Claude ツール定義が手に入る。
API Pick は Tavily のラッパー?
違う。API Pick はインデックス集約・ランキング・スニペット整形を独自に実装。返却形式は意図的にシンプル:title + URL + LLM 向け snippet、必要なら country / date フィルター。POST /api/search/web を直接叩けばよく、ホスト型 RAG レイヤーは挟まない。
レイテンシは?
4 社とも同期エージェント呼び出し向け設計で、短いクエリの P50 はサブ秒。本当の差は、検索エンドポイント内部で下流 LLM 呼び出しを走らせるかどうか。純検索 API は「検索 + 回答」型より常に速い。
Tavily の代替で一番近いのは?
月額下限や超過費用の不透明さで Tavily を離れたいなら、API Pick Web Search が最も近い従量課金の代替:同じ形式(snippet 付き ranked JSON)、country / date フィルター、月額下限なし。
この記事で使われている API
API Pick の CEO。AI エージェントと LLM ワークフロー向けの本番運用可能な API について執筆。