2026 年版・AI エージェント向け Web 検索 API ベスト比較

2025 年に Bing Search が引退し、その穴を埋めようと十数社のエージェントネイティブ検索 API が一斉に登場した。誰が何を返し、誰がどう課金し、自分のエージェントにどれを組み込むべきか — 最新の実用マップをまとめた。
要点
- •市場は 2 つに割れた:クリーンで ranked、LLM 向けに整形済みのテキストを返すエージェントネイティブ検索 API(Exa、Tavily、Linkup、Parallel、API Pick)と、生の Google 結果を返して整形は自分でやる SERP スクレイピング API(Serper、SerpApi)。
- •Microsoft が 2025 年 8 月 11 日に Bing Search API を引退させたこと — これが 2026 年に各チームが検索プロバイダを選び直す最大の理由。
- •「回答(Answer)」エンドポイント(Perplexity Sonar、Brave Answers、Exa の /answer)は検索に LLM 呼び出しをバンドルするため割高になる。純検索エンドポイントの方が速く返り、モデルを自分でコントロールできる。
- •2026 年に公開されたリスト価格は、生の結果なら 1,000 検索あたり $5〜$10 前後に集まる。モデル組み込み検索(OpenAI、Anthropic)や Bing grounding は 1,000 件あたり $10〜$35 に位置する。
- •成功時のみ課金の従量課金エージェントツール呼び出しなら、API Pick Web Search は 1 回 15 credits(約 $0.015)で月額下限なし。
このリストが 1 年前と違って見える理由
2025 年から 2026 年にかけて、2 つの出来事が Web 検索 API 市場を作り変えた。第一に、Microsoft が 2025 年 8 月 11 日に Bing Search API を引退させた — 膨大な数の LLM grounding パイプラインを陰で支えてきた働き者だった — そして Grounding with Bing Search という Azure AI Foundry 内の機能に置き換えた。これはドロップイン置換にならない API で、1,000 トランザクションあたり約 $35 で課金される。一夜にして、数千のチームが新しいプロバイダを必要とした。第二に、エージェントネイティブな検索スタートアップの波が大規模な資金を調達し — Exa の評価額約 $700M での $85M シリーズ B、Parallel の $100M ラウンド、Linkup のシード — 人間ではなく言語モデル向けに設計された API を世に出した。
その結果、市場はきれいに 2 つの陣営に分かれ、最初に下す決断は自分がどちらの陣営にいるかだ:
- エージェントネイティブ検索(Exa、Tavily、Linkup、Parallel、Valyu、API Pick):クエリを送ると、短く ranked なタイトル・URL・クリーンなテキストスニペットのリスト — ときには完成した回答 — が、すでにコンテキストウィンドウ向けに整形された形で返ってくる。
- SERP スクレイピング(Serper、SerpApi):Google 結果ページの生 JSON を受け取り、整形・ランキング・スニペット成形は自分で行う。
以下が実用マップだ。価格と上限はすぐ動く — ここに挙げた数値はすべて 2026 年のリスト価格であり、組み込む前に各社の料金ページで確認してほしい。
各候補をひとことずつ
Exa
「AI のための検索エンジン」。Exa は独自の embedding ベースのインデックスを運用し、neural / keyword / auto モードに加えて、/contents、 /answer、/findSimilar、非同期の /research タスクエンドポイント、そして Websets リストビルダーを提供する。生の鮮度よりもトピックの類似度が重要なときに最強。リスト価格は contents 付き検索で 1,000 検索あたり約 $7、月 1,000 リクエストの無料枠で試すハードルが下がる。
Tavily
エージェントネイティブな Web アクセスレイヤー — /search、 /extract、/crawl、/map、 そして新しい /research エンドポイント。1 回の呼び出しで LLM 向けスニペットと任意の生成回答を返す。LangChain エコシステムの中で育ち、公式 MCP サーバを出荷している。2026 年 2 月に Nebius が $275M で買収。ブランドは継続。credit ベースで、basic 検索は 1 credit、advanced は 2、月 1,000 credit の無料枠つき。
Perplexity Sonar
生の結果を返す API ではない — Sonar は完成した引用付きの回答を返す。sonar や sonar-pro といったモデルは 2 つの部分で課金する:トークンコストと、引いてくる Web コンテキストの量に応じてスケールするリクエスト単位の検索手数料。リンクではなくモデルの回答が欲しく、ソース選択を Perplexity に任せてよいときに最適。
Linkup
ソース付き回答に特化した、新しめの独立系検索 API。standard と deep のモードがあり、注目すべき仕掛けとして x402 / USDC マイクロペイメントによるリクエスト単位の支払いに対応している — 自律エージェントが人間のアカウントなしで支払える。Bing API の置き換えを明示的に標榜している。
Parallel
元 Twitter CEO の Parag Agrawal が一から構築したエージェント向け。意味的な目的を渡すと、圧縮されたトークン関連性の高い抜粋を返す。併設の Task API は検証済みの構造化データを返す。リクエスト単位の価格(Base 検索ティアで 1,000 件あたり約 $4)、ベンチマーク主導のポジショニング。
Brave Search API
数少ない真に独立したグローバルインデックスのひとつ — Google や Bing のミラーではない — で、grounding 専用の LLM Context エンドポイントを備える。リスト価格は 1,000 リクエストあたり約 $5。Brave は 2025 年に無料枠を廃止し全員を従量課金に移行させた。これがあらゆる「Bing 代替」リストに登場する理由だ。
Serper
生の Google SERP JSON を大規模に取得する最安の方法 — 量に応じて 1,000 クエリあたり約 $0.30〜$1。LLM 向け整形レイヤーは自分で出荷する。すでにコンテンツエクストラクタを運用しているなら最高、そうでなければ隠れた作業になる。
API Pick Web Search
tool calling 向けに整形された従量課金の意味検索。 POST /api/search/web は最大 10 件の ranked 結果 — タイトル、URL、整形済みスニペット — を返し、任意の country_code と start_date/end_date フィルターに対応する。1 回 15 credits($5 で 5,000 credits、≈ $0.015)、credit は無期限、課金は HTTP 200 のときのみ。
横並び比較
| Exa | Tavily | Perplexity Sonar | Brave | Serper | API Pick | |
|---|---|---|---|---|---|---|
| 陣営 | エージェントネイティブ(ニューラルインデックス) | エージェントネイティブ(Web アクセス) | 回答エンジン | 独立インデックス | SERP スクレイピング | エージェントネイティブ(tool-calling) |
| 返却内容 | ranked URL + contents / highlights | ranked スニペット + 任意の回答 | 完成した引用付き回答 | Web 結果 + LLM Context | 生の Google SERP JSON | ranked title + URL + クリーンな snippet |
| リスト価格 / 1k(2026) | 約 $7(検索 + contents) | 約 $8 basic / 約 $16 advanced | 約 $5〜$14 + トークン | 約 $5 | 約 $0.30〜$1 | 1 回 15 credits(約 $15 / 1k) |
| 無料枠 | 月 1k req | 月 1k credits | トライアル credit | 月 $5 分 credit | 一回限り 2.5k | 開始用の無料 credit |
| 失敗時に課金される? | プラン依存 | プラン依存 | プラン依存 | プラン依存 | クエリ単位で課金 | なし — HTTP 200 のみ |
| Tool schema エンドポイント | — | — | — | — | — | あり — /api/search/web/tool-schema |
| 最適用途 | 意味発見 | ホスト型 RAG / チャット | ドロップインの引用付き回答 | 独立した grounding | 自前 SERP パイプライン | エージェントツール呼び出し、下限なし |
選び方:短い決定ツリー
次の問いに順番に答えれば、すぐに正しい陣営にたどり着く。
- リンクが欲しいか、回答が欲しいか? 完成した引用付きの回答が欲しく、ソース選択をプロバイダに任せてよいなら、Perplexity Sonar(または
/answerエンドポイント)を使う。モデルがどのソースを読むかをコントロールしたいなら、検索 API を使って自分のモデルを走らせる。 - 生の SERP が必要か? パイプラインが本当に Google の完全な結果ページ — ナレッジパネル、places、正確なランキング — を必要とするなら、Serper か SerpApi を使い、自前の整形ステップ分の予算を確保する。
- 鮮度より類似度が重要か?「このページに似たページをもっと見つけて」は Exa の本領だ。独自インデックス上のニューラルランキングのおかげである。
- トラフィックがバースト的、または予算が従量課金か? プロトタイピング中、バッチのリサーチジョブを走らせる、または一時的失敗でリトライするエージェントを作るなら、成功時のみ課金の 1 回単位モデル(API Pick)が月額下限の支払いを避け、リトライ分の支払いも避けてくれる。
実際の統合はどう見えるか
最も摩擦の少ない統合は、ツールスキーマを貼り付けてラッパーを省くものだ。これらの API の多くは JSON ツール定義を自分で手書きさせるが、API Pick は両方の形式を公開している:
# Returns an OpenAI function definition AND a Claude tool-use definition
curl https://www.apipick.com/api/search/web/tool-schemaこれを Claude tool-use ループに組み込むのは、あとは 3 行だ:
import anthropic, requests
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
tools=[schema["claude"]],
messages=[{"role": "user", "content": "What shipped in agent search this week?"}],
)典型的なエージェントネイティブのレスポンスは小さく、そのまま tool_result ブロックに落とし込める:
{
"results": [
{
"title": "Nebius acquires Tavily to add agentic search",
"url": "https://nebius.com/newsroom/...",
"snippet": "Nebius announced an agreement to acquire Tavily, adding\nagentic web search to its AI cloud platform."
}
/* …more */
],
"result_count": 5,
"credits_used": 15,
"remaining_credits": 985
}誰も価格に織り込まないもの:失敗呼び出しとリトライ
エージェントはリトライする。10 件の検索をファンアウトするリサーチエージェントは一時的な 429 や 502 に当たり、素朴なループはそれらを再実行する。クエリ単位で課金する相手では、リトライのたびに金がかかる。サブスクでは、リトライのたびにダッシュボードが示すよりも速く含有 credit を燃やす。リトライを無視する唯一のモデルが 成功時のみ 課金だ — その前の 3 回のタイムアウトではなく、HTTP 200 に対して支払う。バースト的なエージェントトラフィックでは、これが見出しの 1 回あたり価格よりも大きな実世界の節約になることが多い。
これらの API がどれもやらないこと
どの Web 検索 API も「このドメインの 2019 年以降のすべての文書」を確実には返せない — 深いアーカイブのカバレッジには、検索を専用クローラやドメイン特化データセットと組み合わせる必要がある。どれも近似重複の URL を完璧には除去できない。そして、古い、あるいは権威性の低いソースという上流の問題も、どれも解決しない。ソースの品質判断は、依然としてエージェントが下すべき決定だ。検索 API は検索のプリミティブであって、頭脳まるごとではないと捉えるべきだ。
素早く選ぶ
よくある質問
2026 年に AI エージェント向けで最良の Web 検索 API はどれ?
唯一の正解はない — 何を返してほしいかによる。独自インデックス上のニューラル / 意味発見なら Exa が最強。1 回の呼び出しで LLM 向けに整形済みの RAG 結果と任意のバンドル回答が欲しいなら Tavily が合う。引用付きの完成回答なら Perplexity Sonar。整形を自分でやる生の Google 結果なら Serper が最安。整形済み JSON スニペット、country / date フィルター、HTTP 200 のみ課金で従量課金のエージェントツール呼び出しなら、API Pick Web Search が 1 回 15 credits(約 $0.015)でコミットメント不要の選択肢として最も近い。
なぜ 2025〜2026 年に皆が検索 API を乗り換え始めたのか?
Microsoft が 2025 年 8 月 11 日に Bing Search API を引退させ、多くの LLM grounding パイプラインを支えていたエンドポイントを廃止したため。後継の Azure AI Foundry 内の「Grounding with Bing Search」はドロップイン置換にならない API で、1,000 トランザクションあたり約 $35 で課金される。この引退が開発者を独立インデックス(Brave)やエージェントネイティブのスタートアップ(Exa、Tavily、Linkup、Parallel)へと押しやり、2026 年の選び直しの波の主要な引き金になった。
エージェントネイティブ検索 API と SERP API の違いは?
SERP API(Serper、SerpApi)は Google 結果ページの生 JSON — organic リンク、ナレッジパネル、広告 — を人間が見るのとまったく同じ形で返し、整形とランキングは自分で行う。エージェントネイティブ検索 API(Exa、Tavily、Linkup、API Pick)は、コンテキストウィンドウに収まるサイズの、短い ranked なタイトル・URL・整形済みテキストスニペットのリストを返すので、SERP パーサなしでそのまま function-calling ループに組み込める。
2026 年に Web 検索 API は 1,000 回あたりいくらかかる?
公開リスト価格はばらつくので必ず各社のページで確認してほしいが、2026 年のおおよそのマップとして:Brave 約 $5、Tavily 従量課金で約 $8(basic)/ 約 $16(advanced)、Exa 約 $7(contents 付き検索)、Perplexity Sonar 約 $5〜$14 + トークン、Parallel 約 $4〜$9、Serper は生クエリ 1,000 回あたり約 $0.30〜$1、OpenAI / Anthropic の組み込み Web 検索は約 $10。API Pick Web Search は 1 回 15 credits、$5 / 5,000 credits(約 $0.015)で、成功時のみ差し引かれる。
これらの検索 API は OpenAI function calling や Claude tool use で使える?
使える。すべて JSON in / JSON out なので、どれもツール関数としてラップできる。違いは手間:API Pick は GET /api/search/web/tool-schema で既製スキーマを公開しており、OpenAI function 定義と Claude tool-use 定義の両方が返る。手書きで JSON を書く代わりに貼り付ければよい。
Bing Search API の代替として最良の検索 API はどれ?
Bing を何に使っていたかによる。Bing に近い精神の独立したグローバルインデックスなら、Brave Search API が自然な置き換え。LLM grounding に特化するなら、Tavily、Exa、Linkup、API Pick はモデル向けに整形済みのテキストを返す — これは Bing が決してやらなかったことだ。Azure のプロジェクト単位のセットアップや月額下限を避けたいなら、API Pick が従量課金のドロップイン候補になる。
この記事で使われている API
API Pick の CEO。AI エージェントと LLM ワークフロー向けの本番運用可能な API について執筆。