[ blog · comparison ]9 min read

Tavily / Exa / Serper / API Pick 比較：LLM 用の Web 検索 API はどれを選ぶ？

Sarah Choy公開: 2026年5月2日更新: 2026年5月3日読了 9 分

Tavily / Exa / Serper / API Pick はどれも「LLM 用の検索レイヤー」を名乗るが、出力形式・フィルター・課金方式は意外と違う。現場視点での横並び比較。

要点

•ホスト型 RAG で LLM 用回答ブロブを直接欲しい → Tavily（ただし不透明な順位付けと月額下限）。
•ニューラル / 類似度発見が中心、鮮度はそこそこ → Exa（規模が大きいと予算注意）。
•生の Google SERP を自分で整形 → Serper。
•整形済み JSON、呼び出し単位の透明な課金、country / date フィルター、HTTP 200 のみ課金 → API Pick Web Search。

「LLM 用の Web 検索 API」とは何か

汎用検索 API（Google Custom Search、Bing Web Search、SerpAPI）は SERP（検索結果ページ）— 人間がブラウザで見るような青リンクとリッチスニペットの塊 — を返す。これは言語モデルに不向きだ。エージェントが欲しいのは、SERP のパースではなく、整形された ranked リスト：タイトル、URL、コンテキストにそのまま入れられるクリーンなテキスト。本記事の 4 社はすべてこの方向を目指すが、アプローチが違う。

5 つの実用軸で比較する：出力形式、フィルター、課金モデル、統合の手触り、そして「やらないこと」。

4 社をひとことずつ

Tavily

ホスト型 RAG サービス。tavily.search は ranked スニペットを返し、tavily.qna は検索と軽量 LLM 回答をひとまとめにする。「モデルに即答えブロブを渡す」チャットアシスタントに最適。サブスク + credit。

Exa（旧 Metaphor）

ニューラル / 意味インデックス中心。「この URL に似た URL を見つける」、embedding ランキングを軸に、highlights や本文取得を選択可能。鮮度より類似度が重要なときに最強。サブスク + 超過 credit。

Serper

生の Google SERP API。本物の Google 検索結果ページの JSON 構造（organic、knowledge graph、places、videos）をそのまま返す。スニペット整形とランキングは自分で。1 回は安いが、LLM 用整形レイヤーは自作になる。

API Pick Web Search

従量課金、LLM tool calling 向けに整形済みの意味検索。POST /api/search/web はデフォルトで 5 件（最大 10）の ranked 結果：title、URL、クリーン化された LLM 向け snippet、オプションで country_code と start_date / end_date フィルター。1 回 15 credits（≈ $0.015）、成功時のみ課金。

横並び比較表

表は執筆時点の各社の立ち位置。導入前に各社の料金ページで最新価格と上限を確認してください。

	Tavily	Exa	Serper	API Pick
出力形式	ranked スニペット + 任意の LLM 回答	ranked URL + 任意の highlights / 本文	生の Google SERP JSON	ranked title + URL + LLM 向け snippet
国フィルター	あり	限定的	あり	あり（country_code）
日付フィルター	あり	あり	あり（qdr）	あり（start_date / end_date）
Tool schema エンドポイント	—	—	—	あり — GET /api/search/web/tool-schema
課金モデル	サブスク + credit	サブスク + credit	クエリ単価	従量課金 credit、$5 / 5,000
失敗時の課金	プラン依存	プラン依存	課金	なし — HTTP 200 のみ
最適用途	ホスト RAG / チャット	意味発見 / 類似度	自前 SERP パイプライン	AI エージェントツール、RAG

出力形式：最重要ポイント

このカテゴリーが存在する理由は、LLM が SERP HTML を効率よく推論できないから。LLM が必要とするのは短く、命名された ranked テキスト。だから「snippet がどれだけクリーンか」が、検索 API がエージェントツールとして使えるかの最強の単一指標になる。

Tavily と API Pick は積極的に snippet を整形する。Exa はフラグ次第で highlights か contents を返す — 良いが、量を自分で決める必要がある。Serper は生 SERP を渡し、別途エクストラクタを噛ますことを前提とする。すでにエクストラクタを運用しているならよいが、そうでなければ隠れたコストになる。

API Pick の典型的なレスポンス：

{
  "results": [
    {
      "title": "Retrieval-augmented generation - Wikipedia",
      "url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
      "snippet": "Retrieval-augmented generation (RAG) is a technique that combines\nsearch with text generation, often using vector search to ground LLM\nanswers in retrieved documents."
    }
    /* …more */
  ],
  "result_count": 5,
  "credits_used": 15,
  "remaining_credits": 985
}

この形式は二次パースなしに function calling のツール結果としてモデルに返せる。

フィルター：国と鮮度

本番エージェントは 2 つのフィルター軸を気にする：

国 / 地域：英国の金融エージェントがデフォルトで米国ソースばかり返してはいけない。
日付範囲：「今週何があったか」を聞く市場リサーチエージェントは 1 週間前のものを弾けないと困る。

4 社とも対応するが、表現力が異なる。API Pick は ISO 日付文字列（start_date="2026-04-01"）で曖昧さがなく、Google の qdr（過去 1 時間 / 1 日 / 1 週 / 1 月）より細かい。

課金モデル：サブスク vs 従量

サブスク型（Tavily、Exa）はトラフィックが安定しているときには合うが、以下では使いにくい：

プロトタイピングで月額に縛られたくない。
トラフィックがバースト的（バッチで走るリサーチエージェント等）。
部分失敗を積極的にリトライするエージェント設計。

API Pick は credit モデル — $5 で 5,000 credits、Web Search は 1 回 15 credits、credit に有効期限なし、HTTP 200 のみ課金。これは見た目以上に重要：偶発的な 502 で 5 回リトライしても無料、5× ではない。

統合の手触り

最も摩擦の少ない統合は「JSON ツール定義を貼って終わり」。API Pick は既製品を提供：

# OpenAI function tool 定義
curl https://www.apipick.com/api/search/web/tool-schema

# OpenAI tool + Claude tool use の両方が含まれる

OpenAI Assistants 統合：

from openai import OpenAI
import requests

client = OpenAI()
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()

assistant = client.beta.assistants.create(
    name="Research Agent",
    model="gpt-4o",
    tools=[{"type": "function", "function": schema["openai"]}],
)

Claude tool use：

import anthropic
import requests

schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[schema["claude"]],
    messages=[{"role": "user", "content": "今週の RAG 研究の新展開は？"}],
)

4 社ともやらないこと

どの Web 検索 API も「このドメインの 2019 年以降のすべての X」を確実には返せない。深いアーカイブのカバレッジには検索 + 専用クローラかドメイン特化データセットの組み合わせが必要だ。重複近似の URL も完璧に除去できない。情報源の鮮度や権威性も自分のエージェントで判断するしかない。

クイック選択

最適：ホスト RAG、回答付き

Tavily を選ぶ。単一エンドポイント、モデルがソース選択まで済ませる、チャットアシスタント立ち上げが最速。

最適：意味 / 類似度発見

Exa を選ぶ。ニューラルランキングが中核、embedding は「この URL に似たもの」探索でキーワード検索より強い。

最適：自前 SERP パイプライン

Serper を選ぶ。最安の生 Google SERP JSON、整形は自分で。

最適：AI エージェントツール、透明な価格、月額下限なし

API Pick を選ぶ。整形済み LLM 向け snippet、country / date フィルター、従量課金、成功時のみ課金、貼って使える tool schema。今すぐ試す →

よくある質問

1 回あたりの最安はどれ？

課金モデルが違うので単純比較できない。API Pick Web Search は 1 回 15 credits（$5 / 5,000 credits 換算で約 $0.015）、HTTP 200 のみ課金。Tavily と Exa は月額サブスク + 超過分 credit、Serper はクエリ単位。トラフィックがバースト的、または失敗時にリトライするエージェントなら「成功時のみ課金」が実費で勝つことが多い。

OpenAI function calling と Claude tool use のどちらでも使える？

全社対応。すべて JSON in / JSON out なのでツール関数化できる。API Pick はさらに tool schema エンドポイント（GET /api/search/web/tool-schema）を提供しており、貼り付けるだけの OpenAI / Claude ツール定義が手に入る。

API Pick は Tavily のラッパー？

違う。API Pick はインデックス集約・ランキング・スニペット整形を独自に実装。返却形式は意図的にシンプル：title + URL + LLM 向け snippet、必要なら country / date フィルター。POST /api/search/web を直接叩けばよく、ホスト型 RAG レイヤーは挟まない。