[ blog · comparison ]9 min read

Tavily / Exa / Serper / API Pick 比較:LLM 用の Web 検索 API はどれを選ぶ?

Sarah Choy公開: 2026年5月2日更新: 2026年5月3日読了 9 分
Tavily / Exa / Serper / API Pick 比較:LLM 用の Web 検索 API はどれを選ぶ?

Tavily / Exa / Serper / API Pick はどれも「LLM 用の検索レイヤー」を名乗るが、出力形式・フィルター・課金方式は意外と違う。現場視点での横並び比較。

要点

  • ホスト型 RAG で LLM 用回答ブロブを直接欲しい → Tavily(ただし不透明な順位付けと月額下限)。
  • ニューラル / 類似度発見が中心、鮮度はそこそこ → Exa(規模が大きいと予算注意)。
  • 生の Google SERP を自分で整形 → Serper。
  • 整形済み JSON、呼び出し単位の透明な課金、country / date フィルター、HTTP 200 のみ課金 → API Pick Web Search。

「LLM 用の Web 検索 API」とは何か

汎用検索 API(Google Custom Search、Bing Web Search、SerpAPI)は SERP(検索結果ページ)— 人間がブラウザで見るような青リンクとリッチスニペットの塊 — を返す。これは言語モデルに不向きだ。エージェントが欲しいのは、SERP のパースではなく、整形された ranked リスト:タイトル、URL、コンテキストにそのまま入れられるクリーンなテキスト。本記事の 4 社はすべてこの方向を目指すが、アプローチが違う。

5 つの実用軸で比較する:出力形式、フィルター、課金モデル、統合の手触り、そして「やらないこと」。

4 社をひとことずつ

Tavily

ホスト型 RAG サービス。tavily.search は ranked スニペットを返し、tavily.qna は検索と軽量 LLM 回答をひとまとめにする。 「モデルに即答えブロブを渡す」チャットアシスタントに最適。サブスク + credit。

Exa(旧 Metaphor)

ニューラル / 意味インデックス中心。「この URL に似た URL を見つける」、embedding ランキングを軸に、highlights や本文取得を選択可能。鮮度より類似度が重要なときに最強。サブスク + 超過 credit。

Serper

生の Google SERP API。本物の Google 検索結果ページの JSON 構造(organic、knowledge graph、places、videos)をそのまま返す。スニペット整形とランキングは自分で。1 回は安いが、LLM 用整形レイヤーは自作になる。

従量課金、LLM tool calling 向けに整形済みの意味検索。POST /api/search/web はデフォルトで 5 件(最大 10)の ranked 結果:title、URL、クリーン化された LLM 向け snippet、オプションで country_codestart_date / end_date フィルター。1 回 15 credits(≈ $0.015)、成功時のみ課金。

横並び比較表

表は執筆時点の各社の立ち位置。導入前に各社の料金ページで最新価格と上限を確認してください。
TavilyExaSerperAPI Pick
出力形式ranked スニペット + 任意の LLM 回答ranked URL + 任意の highlights / 本文生の Google SERP JSONranked title + URL + LLM 向け snippet
国フィルターあり限定的ありあり(country_code)
日付フィルターありありあり(qdr)あり(start_date / end_date)
Tool schema エンドポイントあり — GET /api/search/web/tool-schema
課金モデルサブスク + creditサブスク + creditクエリ単価従量課金 credit、$5 / 5,000
失敗時の課金プラン依存プラン依存課金なし — HTTP 200 のみ
最適用途ホスト RAG / チャット意味発見 / 類似度自前 SERP パイプラインAI エージェントツール、RAG

出力形式:最重要ポイント

このカテゴリーが存在する理由は、LLM が SERP HTML を効率よく推論できないから。LLM が必要とするのは短く、命名された ranked テキスト。だから「snippet がどれだけクリーンか」が、検索 API がエージェントツールとして使えるかの最強の単一指標になる。

Tavily と API Pick は積極的に snippet を整形する。Exa はフラグ次第で highlights か contents を返す — 良いが、量を自分で決める必要がある。Serper は生 SERP を渡し、別途エクストラクタを噛ますことを前提とする。すでにエクストラクタを運用しているならよいが、そうでなければ隠れたコストになる。

API Pick の典型的なレスポンス:

{
  "results": [
    {
      "title": "Retrieval-augmented generation - Wikipedia",
      "url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
      "snippet": "Retrieval-augmented generation (RAG) is a technique that combines\nsearch with text generation, often using vector search to ground LLM\nanswers in retrieved documents."
    }
    /* …more */
  ],
  "result_count": 5,
  "credits_used": 15,
  "remaining_credits": 985
}

この形式は二次パースなしに function calling のツール結果としてモデルに返せる。

フィルター:国と鮮度

本番エージェントは 2 つのフィルター軸を気にする:

  • 国 / 地域:英国の金融エージェントがデフォルトで米国ソースばかり返してはいけない。
  • 日付範囲:「今週何があったか」を聞く市場リサーチエージェントは 1 週間前のものを弾けないと困る。

4 社とも対応するが、表現力が異なる。API Pick は ISO 日付文字列(start_date="2026-04-01")で曖昧さがなく、Google の qdr(過去 1 時間 / 1 日 / 1 週 / 1 月)より細かい。

課金モデル:サブスク vs 従量

サブスク型(Tavily、Exa)はトラフィックが安定しているときには合うが、以下では使いにくい:

  • プロトタイピングで月額に縛られたくない。
  • トラフィックがバースト的(バッチで走るリサーチエージェント等)。
  • 部分失敗を積極的にリトライするエージェント設計。

API Pick は credit モデル — $5 で 5,000 credits、Web Search は 1 回 15 credits、credit に有効期限なし、HTTP 200 のみ課金。これは見た目以上に重要:偶発的な 502 で 5 回リトライしても無料、5× ではない。

統合の手触り

最も摩擦の少ない統合は「JSON ツール定義を貼って終わり」。API Pick は既製品を提供:

# OpenAI function tool 定義
curl https://www.apipick.com/api/search/web/tool-schema

# OpenAI tool + Claude tool use の両方が含まれる

OpenAI Assistants 統合:

from openai import OpenAI
import requests

client = OpenAI()
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()

assistant = client.beta.assistants.create(
    name="Research Agent",
    model="gpt-4o",
    tools=[{"type": "function", "function": schema["openai"]}],
)

Claude tool use:

import anthropic
import requests

schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[schema["claude"]],
    messages=[{"role": "user", "content": "今週の RAG 研究の新展開は?"}],
)

4 社ともやらないこと

どの Web 検索 API も「このドメインの 2019 年以降のすべての X」を確実には返せない。深いアーカイブのカバレッジには検索 + 専用クローラかドメイン特化データセットの組み合わせが必要だ。重複近似の URL も完璧に除去できない。情報源の鮮度や権威性も自分のエージェントで判断するしかない。

クイック選択

最適:ホスト RAG、回答付き
Tavily を選ぶ。単一エンドポイント、モデルがソース選択まで済ませる、チャットアシスタント立ち上げが最速。
最適:意味 / 類似度発見
Exa を選ぶ。ニューラルランキングが中核、embedding は「この URL に似たもの」探索でキーワード検索より強い。
最適:自前 SERP パイプライン
Serper を選ぶ。最安の生 Google SERP JSON、整形は自分で。
最適:AI エージェントツール、透明な価格、月額下限なし
API Pick を選ぶ。整形済み LLM 向け snippet、country / date フィルター、従量課金、成功時のみ課金、貼って使える tool schema。今すぐ試す →

よくある質問

1 回あたりの最安はどれ?

課金モデルが違うので単純比較できない。API Pick Web Search は 1 回 15 credits($5 / 5,000 credits 換算で約 $0.015)、HTTP 200 のみ課金。Tavily と Exa は月額サブスク + 超過分 credit、Serper はクエリ単位。トラフィックがバースト的、または失敗時にリトライするエージェントなら「成功時のみ課金」が実費で勝つことが多い。

OpenAI function calling と Claude tool use のどちらでも使える?

全社対応。すべて JSON in / JSON out なのでツール関数化できる。API Pick はさらに tool schema エンドポイント(GET /api/search/web/tool-schema)を提供しており、貼り付けるだけの OpenAI / Claude ツール定義が手に入る。

API Pick は Tavily のラッパー?

違う。API Pick はインデックス集約・ランキング・スニペット整形を独自に実装。返却形式は意図的にシンプル:title + URL + LLM 向け snippet、必要なら country / date フィルター。POST /api/search/web を直接叩けばよく、ホスト型 RAG レイヤーは挟まない。

レイテンシは?

4 社とも同期エージェント呼び出し向け設計で、短いクエリの P50 はサブ秒。本当の差は、検索エンドポイント内部で下流 LLM 呼び出しを走らせるかどうか。純検索 API は「検索 + 回答」型より常に速い。

Tavily の代替で一番近いのは?

月額下限や超過費用の不透明さで Tavily を離れたいなら、API Pick Web Search が最も近い従量課金の代替:同じ形式(snippet 付き ranked JSON)、country / date フィルター、月額下限なし。

この記事で使われている API

Sarah Choy
執筆
Sarah Choy
CEO, API Pick

API Pick の CEO。AI エージェントと LLM ワークフロー向けの本番運用可能な API について執筆。