2026 年给 AI Agent 用的最佳网页搜索 API(横向对比)

Bing Search 在 2025 年退役,紧接着十几家面向 Agent 的搜索 API 抢着来填这个坑。这里给你一张实用、最新的地图:谁返回什么、谁怎么收费、该把哪一个接进你的 Agent。
一句话总结
- •市场一分为二:面向 Agent 的搜索 API(Exa、Tavily、Linkup、Parallel、API Pick)直接吐出干净、ranked、LLM 友好的文本;SERP 抓取型 API(Serper、SerpApi)返回原始 Google 结果、清洗交给你自己做。
- •微软已于 2025 年 8 月 11 日下线 Bing Search API —— 这是 2026 年各团队重新挑选搜索供应商最大的单一原因。
- •「答案」型端点(Perplexity Sonar、Brave Answers、Exa /answer)在搜索里捆绑了一次 LLM 调用,成本更高;纯搜索端点返回更快,且把模型选择权留给你。
- •2026 年公开的牌价里,原始结果大多落在每 1,000 次搜索 $5–$10;模型内置搜索(OpenAI、Anthropic)和 Bing grounding 则在每 1,000 次 $10–$35。
- •若要按量、只对成功扣费的 Agent 工具调用,API Pick Web Search 每次调用 15 credits(≈ $0.015),且没有月费门槛。
为什么这份名单和一年前长得不一样
2025 到 2026 年间,有两件事重塑了网页搜索 API 市场。第一,微软 于 2025 年 8 月 11 日下线了 Bing Search API —— 这个为大量 LLM grounding 管线默默供能的主力 —— 并用 Azure AI Foundry 内的 Grounding with Bing Search 取而代之,而后者并不是即插即用的 API,按约每 1,000 次事务 $35 计费。一夜之间,成千上万个团队需要换一个新供应商。第二,一波 面向 Agent 的搜索初创公司拿到了大笔融资 —— Exa 的 $85M B 轮(约 $700M 估值)、Parallel 的 $100M 轮、Linkup 的种子轮 —— 并推出了为语言模型而非人类设计的 API。
结果就是市场干净地裂成两大阵营,而你要做的第一个决定,就是你站在哪个阵营:
- 面向 Agent 的搜索(Exa、Tavily、Linkup、Parallel、Valyu、API Pick):你发一个查询,拿回一份简短的 ranked 列表 —— 标题、URL、干净的文本 snippet —— 有时还有一个成品答案,全都已经按上下文窗口 shaping 好。
- SERP 抓取(Serper、SerpApi):你拿到 Google 结果页的原始 JSON,清洗、排序、snippet shaping 自己来。
下面是这张实用地图。价格和配额变动很快 —— 这里的每个数字都是 2026 年的牌价,集成前请到各家定价页确认。
各位选手,每个一段话
Exa
「给 AI 用的搜索引擎」。Exa 跑自己的 embedding 索引,提供 neural、keyword 和 auto 模式,外加 /contents、 /answer、/findSimilar、异步的 /research 任务端点,以及 Websets 列表构建器。当主题相似度比原始时效性更重要时表现最强。带 contents 的搜索牌价约每 1,000 次 $7;每月 1,000 次请求的免费额度降低了试用门槛。
Tavily
面向 Agent 的网页接入层 —— /search、 /extract、/crawl、/map,以及更新的 /research 端点。一次调用返回 LLM 友好的 snippet 外加可选的生成答案。它在 LangChain 生态里长大,并提供官方 MCP server。2026 年 2 月被 Nebius 以 $275M 收购,品牌延续。按 credit 计费:basic 搜索 1 credit,advanced 2 credit,每月 1,000 credit 的免费额度。
Perplexity Sonar
不是原始结果 API —— Sonar 返回一个成品的、带引用的答案。像 sonar 和 sonar-pro 这样的模型分两部分计费:token 成本,加上随你拉取的网页上下文量而变的每请求搜索费。当你想要模型的答案而非链接、并且乐意让 Perplexity 替你挑来源时,它最合适。
Linkup
一家更新的独立搜索 API,专注有来源的答案,提供 standard 和 deep 两种模式,还有一个值得注意的招数:通过 x402 / USDC 微支付实现按请求付费,让自主 Agent 在没有人类账户的情况下也能付款。它把自己明确定位成 Bing API 的替代品。
Parallel
由前 Twitter CEO Parag Agrawal 从零为 Agent 打造。你给它一个语义目标,它返回压缩过、与 token 相关的摘录;配套的 Task API 则返回经过校验的结构化数据。按请求定价(Base 搜索档约每 1,000 次 $4),以 benchmark 为卖点。
Brave Search API
少数真正独立的全球索引之一 —— 既不是 Google 也不是 Bing 的镜像 —— 还带一个专门用于 grounding 的 LLM Context 端点。牌价约每 1,000 次请求 $5。Brave 在 2025 年取消了免费额度,把所有人迁到计量计费,这也是它出现在每一份「Bing 替代」名单上的原因。
Serper
大规模拿原始 Google SERP JSON 最便宜的方式 —— 视用量约每 1,000 次查询 $0.30–$1。LLM-shaping 这层你自己交付。如果你已经在跑内容抽取器,那很好;如果没有,这就是隐藏的工作量。
API Pick Web Search
按量计费、为 tool calling shaping 好的语义搜索。 POST /api/search/web 返回最多 10 条 ranked 结果 —— 标题、URL,以及一段预先清洗的 snippet —— 带可选的 country_code 与 start_date/end_date 过滤。每次调用 15 credits($5 买 5,000 credits,≈ $0.015),credit 永不过期,且只对 HTTP 200 扣费。
逐项对比
| Exa | Tavily | Perplexity Sonar | Brave | Serper | API Pick | |
|---|---|---|---|---|---|---|
| 阵营 | 面向 Agent(神经索引) | 面向 Agent(网页接入) | 答案引擎 | 独立索引 | SERP 抓取 | 面向 Agent(工具调用) |
| 返回 | ranked URL + contents/highlights | ranked snippet + 可选答案 | 成品的带引用答案 | 网页结果 + LLM Context | 原始 Google SERP JSON | ranked 标题 + URL + 干净 snippet |
| 牌价 / 1k(2026) | 约 $7(搜索 + contents) | 约 $8 basic / 约 $16 advanced | 约 $5–$14 + token | 约 $5 | 约 $0.30–$1 | 每次 15 credits(约 $15/1k) |
| 免费额度 | 1k 次/月 | 1k credits/月 | 试用 credit | $5/月 credit | 2.5k 一次性 | 起步赠送 credit |
| 失败是否扣费? | 视情况 | 视情况 | 视情况 | 视情况 | 按查询 | 不扣 —— 仅 HTTP 200 |
| Tool schema 端点 | — | — | — | — | — | 有 —— /api/search/web/tool-schema |
| 最佳场景 | 语义发现 | 托管 RAG / 聊天 | 即插即用的带引用答案 | 独立 grounding | 自建 SERP 管线 | Agent 工具调用,无门槛 |
怎么选:一棵简短的决策树
按顺序回答下面几个问题,你会很快落到对的阵营。
- 你要的是链接还是答案? 如果你要一个成品的、带引用的答案,并且不介意让供应商替你挑来源,用 Perplexity Sonar(或某个
/answer端点)。如果你想掌控模型读哪些来源,用搜索 API,自己跑模型。 - 你需要原始 SERP 吗? 如果你的管线确实需要 Google 完整的结果页 —— knowledge panel、places、精确排序 —— 用 Serper 或 SerpApi,并为自己的清洗步骤留出预算。
- 相似度比时效性更重要吗? 「帮我找更多和这个页面相似的页面」是 Exa 的主场,靠的是在自有索引上的神经排序。
- 你的流量是突发型、或预算是按量型吗? 如果你在做原型、跑批量研究任务、或构建会在偶发失败时重试的 Agent,那么按调用计费、只对成功扣费的模型(API Pick)能让你免去月费门槛,也免去为重试买单。
实际集成长什么样
摩擦最低的集成,是你粘贴一个 tool schema、跳过封装层。这些 API 大多让你手写 JSON 工具定义;API Pick 把两种形态都给你:
# 返回一个 OpenAI function 定义,同时附带一个 Claude tool-use 定义
curl https://www.apipick.com/api/search/web/tool-schema接进 Claude tool-use 循环只要三行:
import anthropic, requests
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
tools=[schema["claude"]],
messages=[{"role": "user", "content": "What shipped in agent search this week?"}],
)典型的面向 Agent 响应足够小,可以直接塞进一个 tool_result 块:
{
"results": [
{
"title": "Nebius acquires Tavily to add agentic search",
"url": "https://nebius.com/newsroom/...",
"snippet": "Nebius announced an agreement to acquire Tavily, adding\nagentic web search to its AI cloud platform."
}
/* …more */
],
"result_count": 5,
"credits_used": 15,
"remaining_credits": 985
}没人计入价格的那一项:失败调用与重试
Agent 会重试。一个扇出十次搜索的研究 Agent 会撞上偶发的 429 和 502,而一个朴素的循环会重新跑它们。在按查询计费的供应商那里,每次重试都要花钱。在订阅模型里,每次重试都比你仪表盘显示的更快烧掉额度内的 credit。唯一无视重试的模型是 只对成功扣费 —— 你为那个 HTTP 200 付费,而不是它之前的三次超时。对突发型 Agent 流量来说,这往往比头条上的每次调用价格省得更多。
这些 API 都不做的事
没有一家网页搜索 API 能可靠地回答「这个域名从 2019 年起的每一份文档」—— 深档案覆盖你仍然要把搜索和一个定向爬虫或专门数据集搭配起来。它们都不能完美去重高度相似的 URL。也没有一家能解决上游问题:来源陈旧或权威度低;判断来源质量仍是你的 Agent 要做的决定。把搜索 API 当作检索原语,而不是整个大脑。
快速选型
常见问题
2026 年给 AI Agent 用最好的网页搜索 API 是哪个?
没有唯一的「最好」—— 取决于你想拿回什么。要在自建索引上做神经/语义发现,Exa 最强。要一次调用就拿到 LLM 友好的 RAG 结果、还能可选捆绑一个答案,Tavily 合适。要一个已经写好引用的成品答案,选 Perplexity Sonar。要自己清洗的原始 Google 结果,Serper 最便宜。要按量的 Agent 工具调用、拿预先 shaping 好的 JSON 摘要、按国家与日期过滤、且只对 HTTP 200 收费,API Pick Web Search 是最接近的零承诺选项,每次调用 15 credits(≈ $0.015)。
为什么大家从 2025–2026 年开始集体换搜索 API?
微软于 2025 年 8 月 11 日下线了 Bing Search API,停掉了为大量 LLM grounding 管线供能的端点。替代品 "Grounding with Bing Search"(在 Azure AI Foundry 内)并不是即插即用的 API,且按约每 1,000 次事务 $35 计费。这次退役把开发者推向了独立索引(Brave)和面向 Agent 的初创公司(Exa、Tavily、Linkup、Parallel),也是 2026 年这波重新选型浪潮的主要催化剂。
面向 Agent 的搜索 API 和 SERP API 有什么区别?
SERP API(Serper、SerpApi)返回 Google 结果页的原始 JSON —— organic 链接、knowledge panel、广告 —— 完全是人类用户看到的那个样子,清洗和排序由你自己做。面向 Agent 的搜索 API(Exa、Tavily、Linkup、API Pick)返回的是一份简短的 ranked 列表:标题、URL,以及按上下文窗口尺寸预先清洗好的文本 snippet,可以直接塞进 function-calling 循环,不需要 SERP 解析器。
2026 年这些网页搜索 API 每 1,000 次调用要多少钱?
公开牌价各不相同,请务必到各家定价页确认,但 2026 年大致是这样一张地图:Brave 约 $5,Tavily 按量约 $8(basic)/ 约 $16(advanced),Exa 约 $7(搜索带 contents),Perplexity Sonar 约 $5–$14 外加 token,Parallel 约 $4–$9,Serper 原始查询约每 1,000 次 $0.30–$1,OpenAI/Anthropic 内置网页搜索约 $10。API Pick Web Search 每次调用 15 credits,按 $5 / 5,000 credits 折算(≈ $0.015),且只对成功扣费。
这些搜索 API 能配 OpenAI function calling 和 Claude tool use 吗?
都能。它们都是 JSON in / JSON out,任何一个都能包成 tool function。区别在于摩擦:API Pick 在 GET /api/search/web/tool-schema 提供了现成 schema,同时返回 OpenAI function 定义和 Claude tool-use 定义,粘贴即用,不用手写 JSON。
哪个搜索 API 是最好的 Bing Search API 替代品?
取决于你当初用 Bing 做什么。要一个精神上最接近 Bing 的独立全球索引,Brave Search API 是顺理成章的替代。专门做 LLM grounding 的话,Tavily、Exa、Linkup 和 API Pick 返回的是已经为模型 shaping 好的文本,这是 Bing 从来没做过的。如果你想避开 Azure 的逐项目配置和月费门槛,API Pick 是按量、即插即用的替代。
本文涉及的 API
Sarah Choy 是 API Pick 的 CEO,专注于为 AI Agent 与 LLM 工作流构建可用于生产的 API。