[ blog · comparison ]12 min read

2026 年给 AI Agent 用的最佳网页搜索 API（横向对比）

Sarah Choy发布于 2026年5月29日约 12 分钟阅读

Bing Search 在 2025 年退役，紧接着十几家面向 Agent 的搜索 API 抢着来填这个坑。这里给你一张实用、最新的地图：谁返回什么、谁怎么收费、该把哪一个接进你的 Agent。

一句话总结

•市场一分为二：面向 Agent 的搜索 API（Exa、Tavily、Linkup、Parallel、API Pick）直接吐出干净、ranked、LLM 友好的文本；SERP 抓取型 API（Serper、SerpApi）返回原始 Google 结果、清洗交给你自己做。
•微软已于 2025 年 8 月 11 日下线 Bing Search API —— 这是 2026 年各团队重新挑选搜索供应商最大的单一原因。
•「答案」型端点（Perplexity Sonar、Brave Answers、Exa /answer）在搜索里捆绑了一次 LLM 调用，成本更高；纯搜索端点返回更快，且把模型选择权留给你。
•2026 年公开的牌价里，原始结果大多落在每 1,000 次搜索 $5–$10；模型内置搜索（OpenAI、Anthropic）和 Bing grounding 则在每 1,000 次 $10–$35。
•若要按量、只对成功扣费的 Agent 工具调用，API Pick Web Search 每次调用 15 credits（≈ $0.015），且没有月费门槛。

为什么这份名单和一年前长得不一样

2025 到 2026 年间，有两件事重塑了网页搜索 API 市场。第一，微软 于 2025 年 8 月 11 日下线了 Bing Search API —— 这个为大量 LLM grounding 管线默默供能的主力 —— 并用 Azure AI Foundry 内的 Grounding with Bing Search 取而代之，而后者并不是即插即用的 API，按约每 1,000 次事务 $35 计费。一夜之间，成千上万个团队需要换一个新供应商。第二，一波 面向 Agent 的搜索初创公司拿到了大笔融资 —— Exa 的 $85M B 轮（约 $700M 估值）、Parallel 的 $100M 轮、Linkup 的种子轮 —— 并推出了为语言模型而非人类设计的 API。

结果就是市场干净地裂成两大阵营，而你要做的第一个决定，就是你站在哪个阵营：

面向 Agent 的搜索（Exa、Tavily、Linkup、Parallel、Valyu、API Pick）：你发一个查询，拿回一份简短的 ranked 列表 —— 标题、URL、干净的文本 snippet —— 有时还有一个成品答案，全都已经按上下文窗口 shaping 好。
SERP 抓取（Serper、SerpApi）：你拿到 Google 结果页的原始 JSON，清洗、排序、snippet shaping 自己来。

下面是这张实用地图。价格和配额变动很快 —— 这里的每个数字都是 2026 年的牌价，集成前请到各家定价页确认。

各位选手，每个一段话

Exa

「给 AI 用的搜索引擎」。Exa 跑自己的 embedding 索引，提供 neural、keyword 和 auto 模式，外加 /contents、 /answer、/findSimilar、异步的 /research 任务端点，以及 Websets 列表构建器。当主题相似度比原始时效性更重要时表现最强。带 contents 的搜索牌价约每 1,000 次 $7；每月 1,000 次请求的免费额度降低了试用门槛。

Tavily

面向 Agent 的网页接入层 —— /search、 /extract、/crawl、/map，以及更新的 /research 端点。一次调用返回 LLM 友好的 snippet 外加可选的生成答案。它在 LangChain 生态里长大，并提供官方 MCP server。2026 年 2 月被 Nebius 以 $275M 收购，品牌延续。按 credit 计费：basic 搜索 1 credit，advanced 2 credit，每月 1,000 credit 的免费额度。

Perplexity Sonar

不是原始结果 API —— Sonar 返回一个成品的、带引用的答案。像 sonar 和 sonar-pro 这样的模型分两部分计费：token 成本，加上随你拉取的网页上下文量而变的每请求搜索费。当你想要模型的答案而非链接、并且乐意让 Perplexity 替你挑来源时，它最合适。

Linkup

一家更新的独立搜索 API，专注有来源的答案，提供 standard 和 deep 两种模式，还有一个值得注意的招数：通过 x402 / USDC 微支付实现按请求付费，让自主 Agent 在没有人类账户的情况下也能付款。它把自己明确定位成 Bing API 的替代品。

Parallel

由前 Twitter CEO Parag Agrawal 从零为 Agent 打造。你给它一个语义目标，它返回压缩过、与 token 相关的摘录；配套的 Task API 则返回经过校验的结构化数据。按请求定价（Base 搜索档约每 1,000 次 $4），以 benchmark 为卖点。

Brave Search API

少数真正独立的全球索引之一 —— 既不是 Google 也不是 Bing 的镜像 —— 还带一个专门用于 grounding 的 LLM Context 端点。牌价约每 1,000 次请求 $5。Brave 在 2025 年取消了免费额度，把所有人迁到计量计费，这也是它出现在每一份「Bing 替代」名单上的原因。

Serper

大规模拿原始 Google SERP JSON 最便宜的方式 —— 视用量约每 1,000 次查询 $0.30–$1。LLM-shaping 这层你自己交付。如果你已经在跑内容抽取器，那很好；如果没有，这就是隐藏的工作量。

API Pick Web Search

按量计费、为 tool calling shaping 好的语义搜索。 POST /api/search/web 返回最多 10 条 ranked 结果 —— 标题、URL，以及一段预先清洗的 snippet —— 带可选的 country_code 与 start_date/end_date 过滤。每次调用 15 credits（$5 买 5,000 credits，≈ $0.015），credit 永不过期，且只对 HTTP 200 扣费。

逐项对比

2026 年牌价与定位，为方便对比做了简化。集成前请到各家定价页确认最新报价与配额 —— 有几家按多个维度计费（按结果、按 token、按任务）。

	Exa	Tavily	Perplexity Sonar	Brave	Serper	API Pick
阵营	面向 Agent（神经索引）	面向 Agent（网页接入）	答案引擎	独立索引	SERP 抓取	面向 Agent（工具调用）
返回	ranked URL + contents/highlights	ranked snippet + 可选答案	成品的带引用答案	网页结果 + LLM Context	原始 Google SERP JSON	ranked 标题 + URL + 干净 snippet
牌价 / 1k（2026）	约 $7（搜索 + contents）	约 $8 basic / 约 $16 advanced	约 $5–$14 + token	约 $5	约 $0.30–$1	每次 15 credits（约 $15/1k）
免费额度	1k 次/月	1k credits/月	试用 credit	$5/月 credit	2.5k 一次性	起步赠送 credit
失败是否扣费？	视情况	视情况	视情况	视情况	按查询	不扣 —— 仅 HTTP 200
Tool schema 端点	—	—	—	—	—	有 —— /api/search/web/tool-schema
最佳场景	语义发现	托管 RAG / 聊天	即插即用的带引用答案	独立 grounding	自建 SERP 管线	Agent 工具调用，无门槛

怎么选：一棵简短的决策树

按顺序回答下面几个问题，你会很快落到对的阵营。

你要的是链接还是答案？ 如果你要一个成品的、带引用的答案，并且不介意让供应商替你挑来源，用 Perplexity Sonar（或某个 /answer 端点）。如果你想掌控模型读哪些来源，用搜索 API，自己跑模型。
你需要原始 SERP 吗？ 如果你的管线确实需要 Google 完整的结果页 —— knowledge panel、places、精确排序 —— 用 Serper 或 SerpApi，并为自己的清洗步骤留出预算。
相似度比时效性更重要吗？ 「帮我找更多和这个页面相似的页面」是 Exa 的主场，靠的是在自有索引上的神经排序。
你的流量是突发型、或预算是按量型吗？ 如果你在做原型、跑批量研究任务、或构建会在偶发失败时重试的 Agent，那么按调用计费、只对成功扣费的模型（API Pick）能让你免去月费门槛，也免去为重试买单。

实际集成长什么样

摩擦最低的集成，是你粘贴一个 tool schema、跳过封装层。这些 API 大多让你手写 JSON 工具定义；API Pick 把两种形态都给你：

# 返回一个 OpenAI function 定义，同时附带一个 Claude tool-use 定义
curl https://www.apipick.com/api/search/web/tool-schema

接进 Claude tool-use 循环只要三行：

import anthropic, requests

schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[schema["claude"]],
    messages=[{"role": "user", "content": "What shipped in agent search this week?"}],
)

典型的面向 Agent 响应足够小，可以直接塞进一个 tool_result 块：

{
  "results": [
    {
      "title": "Nebius acquires Tavily to add agentic search",
      "url": "https://nebius.com/newsroom/...",
      "snippet": "Nebius announced an agreement to acquire Tavily, adding\nagentic web search to its AI cloud platform."
    }
    /* …more */
  ],
  "result_count": 5,
  "credits_used": 15,
  "remaining_credits": 985
}

没人计入价格的那一项：失败调用与重试

Agent 会重试。一个扇出十次搜索的研究 Agent 会撞上偶发的 429 和 502，而一个朴素的循环会重新跑它们。在按查询计费的供应商那里，每次重试都要花钱。在订阅模型里，每次重试都比你仪表盘显示的更快烧掉额度内的 credit。唯一无视重试的模型是 只对成功扣费 —— 你为那个 HTTP 200 付费，而不是它之前的三次超时。对突发型 Agent 流量来说，这往往比头条上的每次调用价格省得更多。

这些 API 都不做的事

没有一家网页搜索 API 能可靠地回答「这个域名从 2019 年起的每一份文档」—— 深档案覆盖你仍然要把搜索和一个定向爬虫或专门数据集搭配起来。它们都不能完美去重高度相似的 URL。也没有一家能解决上游问题：来源陈旧或权威度低；判断来源质量仍是你的 Agent 要做的决定。把搜索 API 当作检索原语，而不是整个大脑。

快速选型

最佳场景：语义 / 相似度发现

选 Exa。在自有索引上的神经排序是它的核心论点，每月免费额度让试用很容易。

最佳场景：托管 RAG，可选捆绑答案

选 Tavily。一次调用、LLM 友好、与 LangChain 和 MCP 深度集成。

最佳场景：成品的带引用答案，无需编排

选 Perplexity Sonar。它返回答案；你省掉了 Agent 循环。

最佳场景：作为 Bing 替代的独立索引

选 Brave Search API。真正独立，带一个专门的 LLM Context 端点。

最佳场景：便宜的原始 Google SERP、自己清洗

选 Serper。每次查询成本最低；shaping 层你来交付。

最佳场景：Agent 工具调用、透明的按调用定价、无月费门槛

选 API Pick。预先 shaping 的 LLM 友好 snippet、国家与日期过滤、按量计费、只对成功扣费、tool schema 粘贴即用。立即试用 Web Search →

常见问题

2026 年给 AI Agent 用最好的网页搜索 API 是哪个？

没有唯一的「最好」—— 取决于你想拿回什么。要在自建索引上做神经/语义发现，Exa 最强。要一次调用就拿到 LLM 友好的 RAG 结果、还能可选捆绑一个答案，Tavily 合适。要一个已经写好引用的成品答案，选 Perplexity Sonar。要自己清洗的原始 Google 结果，Serper 最便宜。要按量的 Agent 工具调用、拿预先 shaping 好的 JSON 摘要、按国家与日期过滤、且只对 HTTP 200 收费，API Pick Web Search 是最接近的零承诺选项，每次调用 15 credits（≈ $0.015）。

为什么大家从 2025–2026 年开始集体换搜索 API？

微软于 2025 年 8 月 11 日下线了 Bing Search API，停掉了为大量 LLM grounding 管线供能的端点。替代品 "Grounding with Bing Search"（在 Azure AI Foundry 内）并不是即插即用的 API，且按约每 1,000 次事务 $35 计费。这次退役把开发者推向了独立索引（Brave）和面向 Agent 的初创公司（Exa、Tavily、Linkup、Parallel），也是 2026 年这波重新选型浪潮的主要催化剂。

面向 Agent 的搜索 API 和 SERP API 有什么区别？

SERP API（Serper、SerpApi）返回 Google 结果页的原始 JSON —— organic 链接、knowledge panel、广告 —— 完全是人类用户看到的那个样子，清洗和排序由你自己做。面向 Agent 的搜索 API（Exa、Tavily、Linkup、API Pick）返回的是一份简短的 ranked 列表：标题、URL，以及按上下文窗口尺寸预先清洗好的文本 snippet，可以直接塞进 function-calling 循环，不需要 SERP 解析器。

2026 年这些网页搜索 API 每 1,000 次调用要多少钱？

公开牌价各不相同，请务必到各家定价页确认，但 2026 年大致是这样一张地图：Brave 约 $5，Tavily 按量约 $8（basic）/ 约 $16（advanced），Exa 约 $7（搜索带 contents），Perplexity Sonar 约 $5–$14 外加 token，Parallel 约 $4–$9，Serper 原始查询约每 1,000 次 $0.30–$1，OpenAI/Anthropic 内置网页搜索约 $10。API Pick Web Search 每次调用 15 credits，按 $5 / 5,000 credits 折算（≈ $0.015），且只对成功扣费。

这些搜索 API 能配 OpenAI function calling 和 Claude tool use 吗？

都能。它们都是 JSON in / JSON out，任何一个都能包成 tool function。区别在于摩擦：API Pick 在 GET /api/search/web/tool-schema 提供了现成 schema，同时返回 OpenAI function 定义和 Claude tool-use 定义，粘贴即用，不用手写 JSON。

哪个搜索 API 是最好的 Bing Search API 替代品？

取决于你当初用 Bing 做什么。要一个精神上最接近 Bing 的独立全球索引，Brave Search API 是顺理成章的替代。专门做 LLM grounding 的话，Tavily、Exa、Linkup 和 API Pick 返回的是已经为模型 shaping 好的文本，这是 Bing 从来没做过的。如果你想避开 Azure 的逐项目配置和月费门槛，API Pick 是按量、即插即用的替代。

本文涉及的 API

网页搜索

为LLM工具调用而生的实时语义网页搜索。返回排序后的标题、URL和清洁的摘要，预先成型适配智能体消费。支持国家与日期过滤。

新闻搜索

覆盖主流媒体的实时新闻搜索。日期范围与国家过滤，适合时效性查询。为晨间简报、市场新闻智能体和RAG管线而生。

URL内容提取

单次调用从最多25个URL提取干净可读的内容。剥离广告、导航和样板，返回类Markdown文本，可直接供LLM使用。每个URL消耗2积分。

作者

Sarah Choy

CEO, API Pick

Sarah Choy 是 API Pick 的 CEO，专注于为 AI Agent 与 LLM 工作流构建可用于生产的 API。