[ blog · comparison ]12 min read

2026 年给 AI Agent 用的最佳网页搜索 API(横向对比)

Sarah Choy发布于 2026年5月29日约 12 分钟阅读
2026 年给 AI Agent 用的最佳网页搜索 API(横向对比)

Bing Search 在 2025 年退役,紧接着十几家面向 Agent 的搜索 API 抢着来填这个坑。这里给你一张实用、最新的地图:谁返回什么、谁怎么收费、该把哪一个接进你的 Agent。

一句话总结

  • 市场一分为二:面向 Agent 的搜索 API(Exa、Tavily、Linkup、Parallel、API Pick)直接吐出干净、ranked、LLM 友好的文本;SERP 抓取型 API(Serper、SerpApi)返回原始 Google 结果、清洗交给你自己做。
  • 微软已于 2025 年 8 月 11 日下线 Bing Search API —— 这是 2026 年各团队重新挑选搜索供应商最大的单一原因。
  • 「答案」型端点(Perplexity Sonar、Brave Answers、Exa /answer)在搜索里捆绑了一次 LLM 调用,成本更高;纯搜索端点返回更快,且把模型选择权留给你。
  • 2026 年公开的牌价里,原始结果大多落在每 1,000 次搜索 $5–$10;模型内置搜索(OpenAI、Anthropic)和 Bing grounding 则在每 1,000 次 $10–$35。
  • 若要按量、只对成功扣费的 Agent 工具调用,API Pick Web Search 每次调用 15 credits(≈ $0.015),且没有月费门槛。

为什么这份名单和一年前长得不一样

2025 到 2026 年间,有两件事重塑了网页搜索 API 市场。第一,微软 于 2025 年 8 月 11 日下线了 Bing Search API —— 这个为大量 LLM grounding 管线默默供能的主力 —— 并用 Azure AI Foundry 内的 Grounding with Bing Search 取而代之,而后者并不是即插即用的 API,按约每 1,000 次事务 $35 计费。一夜之间,成千上万个团队需要换一个新供应商。第二,一波 面向 Agent 的搜索初创公司拿到了大笔融资 —— Exa 的 $85M B 轮(约 $700M 估值)、Parallel 的 $100M 轮、Linkup 的种子轮 —— 并推出了为语言模型而非人类设计的 API。

结果就是市场干净地裂成两大阵营,而你要做的第一个决定,就是你站在哪个阵营:

  • 面向 Agent 的搜索(Exa、Tavily、Linkup、Parallel、Valyu、API Pick):你发一个查询,拿回一份简短的 ranked 列表 —— 标题、URL、干净的文本 snippet —— 有时还有一个成品答案,全都已经按上下文窗口 shaping 好。
  • SERP 抓取(Serper、SerpApi):你拿到 Google 结果页的原始 JSON,清洗、排序、snippet shaping 自己来。

下面是这张实用地图。价格和配额变动很快 —— 这里的每个数字都是 2026 年的牌价,集成前请到各家定价页确认。

各位选手,每个一段话

Exa

「给 AI 用的搜索引擎」。Exa 跑自己的 embedding 索引,提供 neural、keyword 和 auto 模式,外加 /contents /answer/findSimilar、异步的 /research 任务端点,以及 Websets 列表构建器。当主题相似度比原始时效性更重要时表现最强。带 contents 的搜索牌价约每 1,000 次 $7;每月 1,000 次请求的免费额度降低了试用门槛。

Tavily

面向 Agent 的网页接入层 —— /search /extract/crawl/map,以及更新的 /research 端点。一次调用返回 LLM 友好的 snippet 外加可选的生成答案。它在 LangChain 生态里长大,并提供官方 MCP server。2026 年 2 月被 Nebius 以 $275M 收购,品牌延续。按 credit 计费:basic 搜索 1 credit,advanced 2 credit,每月 1,000 credit 的免费额度。

Perplexity Sonar

不是原始结果 API —— Sonar 返回一个成品的、带引用的答案。像 sonarsonar-pro 这样的模型分两部分计费:token 成本,加上随你拉取的网页上下文量而变的每请求搜索费。当你想要模型的答案而非链接、并且乐意让 Perplexity 替你挑来源时,它最合适。

Linkup

一家更新的独立搜索 API,专注有来源的答案,提供 standard 和 deep 两种模式,还有一个值得注意的招数:通过 x402 / USDC 微支付实现按请求付费,让自主 Agent 在没有人类账户的情况下也能付款。它把自己明确定位成 Bing API 的替代品。

Parallel

由前 Twitter CEO Parag Agrawal 从零为 Agent 打造。你给它一个语义目标,它返回压缩过、与 token 相关的摘录;配套的 Task API 则返回经过校验的结构化数据。按请求定价(Base 搜索档约每 1,000 次 $4),以 benchmark 为卖点。

Brave Search API

少数真正独立的全球索引之一 —— 既不是 Google 也不是 Bing 的镜像 —— 还带一个专门用于 grounding 的 LLM Context 端点。牌价约每 1,000 次请求 $5。Brave 在 2025 年取消了免费额度,把所有人迁到计量计费,这也是它出现在每一份「Bing 替代」名单上的原因。

Serper

大规模拿原始 Google SERP JSON 最便宜的方式 —— 视用量约每 1,000 次查询 $0.30–$1。LLM-shaping 这层你自己交付。如果你已经在跑内容抽取器,那很好;如果没有,这就是隐藏的工作量。

按量计费、为 tool calling shaping 好的语义搜索。 POST /api/search/web 返回最多 10 条 ranked 结果 —— 标题、URL,以及一段预先清洗的 snippet —— 带可选的 country_code start_date/end_date 过滤。每次调用 15 credits($5 买 5,000 credits,≈ $0.015),credit 永不过期,且只对 HTTP 200 扣费。

逐项对比

2026 年牌价与定位,为方便对比做了简化。集成前请到各家定价页确认最新报价与配额 —— 有几家按多个维度计费(按结果、按 token、按任务)。
ExaTavilyPerplexity SonarBraveSerperAPI Pick
阵营面向 Agent(神经索引)面向 Agent(网页接入)答案引擎独立索引SERP 抓取面向 Agent(工具调用)
返回ranked URL + contents/highlightsranked snippet + 可选答案成品的带引用答案网页结果 + LLM Context原始 Google SERP JSONranked 标题 + URL + 干净 snippet
牌价 / 1k(2026)约 $7(搜索 + contents)约 $8 basic / 约 $16 advanced约 $5–$14 + token约 $5约 $0.30–$1每次 15 credits(约 $15/1k)
免费额度1k 次/月1k credits/月试用 credit$5/月 credit2.5k 一次性起步赠送 credit
失败是否扣费?视情况视情况视情况视情况按查询不扣 —— 仅 HTTP 200
Tool schema 端点有 —— /api/search/web/tool-schema
最佳场景语义发现托管 RAG / 聊天即插即用的带引用答案独立 grounding自建 SERP 管线Agent 工具调用,无门槛

怎么选:一棵简短的决策树

按顺序回答下面几个问题,你会很快落到对的阵营。

  • 你要的是链接还是答案? 如果你要一个成品的、带引用的答案,并且不介意让供应商替你挑来源,用 Perplexity Sonar(或某个 /answer 端点)。如果你想掌控模型读哪些来源,用搜索 API,自己跑模型。
  • 你需要原始 SERP 吗? 如果你的管线确实需要 Google 完整的结果页 —— knowledge panel、places、精确排序 —— 用 Serper 或 SerpApi,并为自己的清洗步骤留出预算。
  • 相似度比时效性更重要吗? 「帮我找更多和这个页面相似的页面」是 Exa 的主场,靠的是在自有索引上的神经排序。
  • 你的流量是突发型、或预算是按量型吗? 如果你在做原型、跑批量研究任务、或构建会在偶发失败时重试的 Agent,那么按调用计费、只对成功扣费的模型(API Pick)能让你免去月费门槛,也免去为重试买单。

实际集成长什么样

摩擦最低的集成,是你粘贴一个 tool schema、跳过封装层。这些 API 大多让你手写 JSON 工具定义;API Pick 把两种形态都给你:

# 返回一个 OpenAI function 定义,同时附带一个 Claude tool-use 定义
curl https://www.apipick.com/api/search/web/tool-schema

接进 Claude tool-use 循环只要三行:

import anthropic, requests

schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[schema["claude"]],
    messages=[{"role": "user", "content": "What shipped in agent search this week?"}],
)

典型的面向 Agent 响应足够小,可以直接塞进一个 tool_result 块:

{
  "results": [
    {
      "title": "Nebius acquires Tavily to add agentic search",
      "url": "https://nebius.com/newsroom/...",
      "snippet": "Nebius announced an agreement to acquire Tavily, adding\nagentic web search to its AI cloud platform."
    }
    /* …more */
  ],
  "result_count": 5,
  "credits_used": 15,
  "remaining_credits": 985
}

没人计入价格的那一项:失败调用与重试

Agent 会重试。一个扇出十次搜索的研究 Agent 会撞上偶发的 429 和 502,而一个朴素的循环会重新跑它们。在按查询计费的供应商那里,每次重试都要花钱。在订阅模型里,每次重试都比你仪表盘显示的更快烧掉额度内的 credit。唯一无视重试的模型是 只对成功扣费 —— 你为那个 HTTP 200 付费,而不是它之前的三次超时。对突发型 Agent 流量来说,这往往比头条上的每次调用价格省得更多。

这些 API 都不做的事

没有一家网页搜索 API 能可靠地回答「这个域名从 2019 年起的每一份文档」—— 深档案覆盖你仍然要把搜索和一个定向爬虫或专门数据集搭配起来。它们都不能完美去重高度相似的 URL。也没有一家能解决上游问题:来源陈旧或权威度低;判断来源质量仍是你的 Agent 要做的决定。把搜索 API 当作检索原语,而不是整个大脑。

快速选型

最佳场景:语义 / 相似度发现
选 Exa。在自有索引上的神经排序是它的核心论点,每月免费额度让试用很容易。
最佳场景:托管 RAG,可选捆绑答案
选 Tavily。一次调用、LLM 友好、与 LangChain 和 MCP 深度集成。
最佳场景:成品的带引用答案,无需编排
选 Perplexity Sonar。它返回答案;你省掉了 Agent 循环。
最佳场景:作为 Bing 替代的独立索引
选 Brave Search API。真正独立,带一个专门的 LLM Context 端点。
最佳场景:便宜的原始 Google SERP、自己清洗
选 Serper。每次查询成本最低;shaping 层你来交付。
最佳场景:Agent 工具调用、透明的按调用定价、无月费门槛
选 API Pick。预先 shaping 的 LLM 友好 snippet、国家与日期过滤、按量计费、只对成功扣费、tool schema 粘贴即用。立即试用 Web Search →

常见问题

2026 年给 AI Agent 用最好的网页搜索 API 是哪个?

没有唯一的「最好」—— 取决于你想拿回什么。要在自建索引上做神经/语义发现,Exa 最强。要一次调用就拿到 LLM 友好的 RAG 结果、还能可选捆绑一个答案,Tavily 合适。要一个已经写好引用的成品答案,选 Perplexity Sonar。要自己清洗的原始 Google 结果,Serper 最便宜。要按量的 Agent 工具调用、拿预先 shaping 好的 JSON 摘要、按国家与日期过滤、且只对 HTTP 200 收费,API Pick Web Search 是最接近的零承诺选项,每次调用 15 credits(≈ $0.015)。

为什么大家从 2025–2026 年开始集体换搜索 API?

微软于 2025 年 8 月 11 日下线了 Bing Search API,停掉了为大量 LLM grounding 管线供能的端点。替代品 "Grounding with Bing Search"(在 Azure AI Foundry 内)并不是即插即用的 API,且按约每 1,000 次事务 $35 计费。这次退役把开发者推向了独立索引(Brave)和面向 Agent 的初创公司(Exa、Tavily、Linkup、Parallel),也是 2026 年这波重新选型浪潮的主要催化剂。

面向 Agent 的搜索 API 和 SERP API 有什么区别?

SERP API(Serper、SerpApi)返回 Google 结果页的原始 JSON —— organic 链接、knowledge panel、广告 —— 完全是人类用户看到的那个样子,清洗和排序由你自己做。面向 Agent 的搜索 API(Exa、Tavily、Linkup、API Pick)返回的是一份简短的 ranked 列表:标题、URL,以及按上下文窗口尺寸预先清洗好的文本 snippet,可以直接塞进 function-calling 循环,不需要 SERP 解析器。

2026 年这些网页搜索 API 每 1,000 次调用要多少钱?

公开牌价各不相同,请务必到各家定价页确认,但 2026 年大致是这样一张地图:Brave 约 $5,Tavily 按量约 $8(basic)/ 约 $16(advanced),Exa 约 $7(搜索带 contents),Perplexity Sonar 约 $5–$14 外加 token,Parallel 约 $4–$9,Serper 原始查询约每 1,000 次 $0.30–$1,OpenAI/Anthropic 内置网页搜索约 $10。API Pick Web Search 每次调用 15 credits,按 $5 / 5,000 credits 折算(≈ $0.015),且只对成功扣费。

这些搜索 API 能配 OpenAI function calling 和 Claude tool use 吗?

都能。它们都是 JSON in / JSON out,任何一个都能包成 tool function。区别在于摩擦:API Pick 在 GET /api/search/web/tool-schema 提供了现成 schema,同时返回 OpenAI function 定义和 Claude tool-use 定义,粘贴即用,不用手写 JSON。

哪个搜索 API 是最好的 Bing Search API 替代品?

取决于你当初用 Bing 做什么。要一个精神上最接近 Bing 的独立全球索引,Brave Search API 是顺理成章的替代。专门做 LLM grounding 的话,Tavily、Exa、Linkup 和 API Pick 返回的是已经为模型 shaping 好的文本,这是 Bing 从来没做过的。如果你想避开 Azure 的逐项目配置和月费门槛,API Pick 是按量、即插即用的替代。

本文涉及的 API

Sarah Choy
作者
Sarah Choy
CEO, API Pick

Sarah Choy 是 API Pick 的 CEO,专注于为 AI Agent 与 LLM 工作流构建可用于生产的 API。