[ blog · deep-dive ]10 min read

Agentic search vs SERP scraping: vì sao agent cần một API khác

Sarah ChoyĐăng ngày 29 tháng 5, 202610 phút đọc

Suốt hai mươi năm, một API tìm kiếm có nghĩa là 'cào trang kết quả của Google'. Các AI agent đã phá vỡ giả định đó. Đây là bản chất thực sự của agentic search, vì sao nó xuất hiện, và khi nào mô hình SERP cũ vẫn còn hợp lý.

Tóm tắt

•Agentic search là tìm kiếm web được thiết kế để một AI agent tiêu thụ: bạn gửi một mục tiêu ngữ nghĩa và nhận về một danh sách ngắn, đã xếp hạng gồm các đoạn văn bản sạch, có thể trích dẫn, được định cỡ cho cửa sổ ngữ cảnh.
•SERP scraping trả về HTML/JSON thô của một trang kết quả tìm kiếm — được xây cho con người và dashboard, không phải cho mô hình ngôn ngữ.
•Sự chuyển dịch diễn ra vì LLM suy luận trên văn bản ngắn đã xếp hạng, chứ không phải trên một khối SERP, và vì Microsoft đã ngừng Bing Search API vào tháng 8 năm 2025, buộc cả thị trường phải chọn lại nhà cung cấp.
•Agentic search bổ sung ba thứ mà các API SERP thiếu: snippet đã được làm sạch sẵn, câu trả lời có căn cứ tùy chọn, và cách tính phí thân thiện với agent (theo lượt gọi, thường chỉ tính khi thành công).
•SERP scraping vẫn thắng thế khi bạn thực sự cần toàn bộ trang kết quả của Google — thứ hạng, knowledge panel, local pack — và tự vận hành pipeline làm sạch của riêng mình.

Một định nghĩa, nói trước

Agentic search là tìm kiếm web được thiết kế để một AI agent tiêu thụ thay vì hiển thị cho con người. Bạn gửi một truy vấn — hoặc một mục tiêu ngữ nghĩa ở tầng cao hơn — và bạn nhận về một danh sách ngắn, đã xếp hạng gồm tiêu đề, URL và các đoạn văn bản đã được làm sạch sẵn, đôi khi là một câu trả lời hoàn chỉnh kèm trích dẫn, vốn đã được định dạng để đưa thẳng vào cửa sổ ngữ cảnh của mô hình ngôn ngữ.

Đó là một sản phẩm khác hẳn với những gì "một API tìm kiếm" đã có nghĩa suốt hai mươi năm trước đó. Suốt hai thập kỷ, một API tìm kiếm có nghĩa là: cho tôi trang kết quả mà một con người sẽ nhìn thấy. Chính giả định đó là thứ mà các AI agent đã phá vỡ.

Mô hình cũ: SERP scraping

Một API SERP (search engine results page) trả về JSON có cấu trúc của một trang kết quả Google hoặc Bing — liên kết tự nhiên, knowledge panel, "people also ask", local pack, quảng cáo, carousel shopping. Các công cụ như Serper và SerpApi làm việc này cực kỳ tốt và rẻ. Đầu ra trung thực với những gì một người nhìn thấy trong trình duyệt:

{
  "organic": [
    { "position": 1, "title": "…", "link": "https://…", "snippet": "…" },
    { "position": 2, "title": "…", "link": "https://…", "snippet": "…" }
  ],
  "knowledgeGraph": { "title": "…", "type": "…", "description": "…" },
  "peopleAlsoAsk": [ /* … */ ],
  "relatedSearches": [ /* … */ ]
}

Điều này hoàn hảo cho một dashboard SEO, một công cụ theo dõi thứ hạng, hoặc một công cụ nghiên cứu có con người trong vòng lặp. Nó sai hình dạng đối với một mô hình ngôn ngữ, vì một lý do thẳng thừng: một mô hình không thể suy luận hiệu quả trên một khối SERP. Nó suy luận trên văn bản ngắn, có tên và đã xếp hạng. Đưa cho một mô hình toàn bộ một SERP và bạn đang tiêu token ngữ cảnh vào metadata bố cục, quảng cáo và "related searches" chẳng liên quan gì đến câu trả lời.

Mô hình mới: agentic search

Agentic search vứt bỏ SERP và chỉ trả về những gì một agent có thể dùng. Cùng truy vấn ấy quay lại dưới dạng một danh sách gọn gàng, đã xếp hạng gồm các đoạn văn bản sạch:

{
  "results": [
    {
      "title": "Retrieval-augmented generation - Wikipedia",
      "url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
      "snippet": "Retrieval-augmented generation (RAG) combines search with\ntext generation, grounding LLM answers in retrieved documents."
    }
    /* …4 more, ranked */
  ],
  "result_count": 5,
  "credits_used": 15
}

Hình dạng này mã hóa ba quyết định có chủ đích mà một API SERP để lại cho bạn:

Snippet đã được làm sạch sẵn. Phần rác — thanh điều hướng, banner cookie, quảng cáo — bị loại bỏ, nên mô hình dành ngữ cảnh của mình cho tín hiệu.
Xếp hạng theo độ liên quan, không phải theo quảng cáo. Kết quả được sắp theo mức hữu ích đối với truy vấn, chứ không theo một bố cục trang kết quả kiếm tiền từ các vị trí đầu.
Một ngân sách kích cỡ. Một nhúm kết quả, không phải một trăm, vì cửa sổ ngữ cảnh và ngân sách token là hữu hạn.

Vì sao sự chuyển dịch xảy ra vào lúc này

Hai lực đẩy hội tụ trong giai đoạn 2025–2026.

1. LLM biến định dạng SERP thành gánh nặng

Ngay khi các agent bắt đầu gọi tìm kiếm như một công cụ, sự lệch pha trở nên hiển nhiên. Mỗi token tiêu vào giàn giáo của SERP là một token không tiêu vào các nguồn thực sự, và mỗi trang chưa được làm sạch là một chỗ để mô hình bị phân tâm hoặc trích dẫn một banner cookie. Các đội ngũ nhận ra mình đang viết một lớp làm sạch và xếp hạng đè lên trên mỗi API SERP — chính là lớp mà agentic search tích hợp sẵn.

2. Việc ngừng Bing buộc phải chọn lại

Vào ngày 11 tháng 8 năm 2025, Microsoft ngừng các Bing Search API, gỡ bỏ các endpoint đã âm thầm căn cứ cho một phần lớn các pipeline LLM. Bản thay thế — Grounding with Bing Search bên trong Azure AI Foundry — không phải là một API drop-in và tính phí khoảng $35 cho mỗi 1.000 giao dịch. Hàng nghìn đội ngũ phải chọn nhà cung cấp mới đúng vào thời điểm một làn sóng startup thuần agent ra mắt: Exa gọi vốn Series B $85M, Parallel gọi $100M, Tavily được Nebius mua lại với giá $275M, Linkup gọi một vòng seed. Danh mục này không chỉ xuất hiện — nó được rót vốn và bị đẩy ra ánh sáng.

SERP scraping vs agentic search: bảng so sánh trung thực

Tính theo mỗi truy vấn, SERP scraping rẻ hơn; một khi bạn cộng thêm lớp làm sạch mà agentic search đã bao gồm, khoảng cách tổng chi phí thu hẹp lại. Giá là con số niêm yết năm 2026 — hãy xác nhận trên trang của mỗi nhà cung cấp.

	SERP scraping	Agentic search
Trả về	JSON trang kết quả thô	Snippet đã xếp hạng, sạch, sẵn sàng cho LLM
Xây cho	Con người, dashboard, theo dõi thứ hạng	AI agent, RAG, tool calling
Bước làm sạch	Bạn tự xây	Đã bao gồm
Hiệu quả token	Thấp (bố cục + quảng cáo trong payload)	Cao (chỉ tín hiệu)
Chế độ trả lời	Không	Thường có (gộp sẵn hoặc /answer riêng)
Giá thô / 1k	~$0.30–$1	~$5–$16
Giá toàn pipeline	+ bộ trích xuất của bạn + thời gian kỹ thuật	Gần hơn tưởng tượng
Phù hợp nhất cho	SEO, tính năng SERP, pipeline tự xây	Căn cứ câu trả lời LLM trong một agent

Bài toán kinh tế mà không ai đưa lên trang giá

Cú sốc giá — "agentic search đắt gấp 10 lần Serper" — biến mất khi bạn tính chi phí của toàn bộ pipeline. Một API SERP cho bạn một trang kết quả; để nuôi một mô hình, sau đó bạn phải chạy một bộ trích xuất nội dung trên các liên kết đã chọn, cộng thêm phần kỹ thuật để xây và bảo trì logic làm sạch và xếp hạng. Agentic search gói tất cả những thứ đó vào trong lượt gọi. Bạn không trả gấp 10 lần cho cùng một thứ; bạn đang trả một lần cho hai bước thay vì trả hai lần cho hai bước.

Có một chi phí thứ hai, âm thầm hơn: những lần thử lại. Các agent tỏa ra và thử lại khi gặp lỗi thoáng qua. Với một dịch vụ SERP tính phí theo truy vấn, mỗi lần thử lại đều bị tính tiền. Cách phòng thủ gọn gàng nhất là tính phí chỉ khi thành công — bạn trả cho HTTP 200, không phải cho ba lần timeout trước đó. Với lưu lượng agent bùng nổ theo đợt, riêng quy tắc tính phí ấy thường tiết kiệm nhiều hơn cả chênh lệch giá mỗi lượt gọi giữa các nhà cung cấp.

Xây dựng trên agentic search: vòng lặp tối giản

Vì đầu ra đã được định hình sẵn cho mô hình, phần tích hợp rất ngắn. Kéo về một tool schema, đưa nó cho mô hình của bạn, và để nó gọi tìm kiếm như một công cụ:

import anthropic, requests

# Agentic search ships a ready-made tool definition — no hand-written JSON
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[schema["claude"]],
    messages=[{"role": "user", "content": "What is agentic search, with sources?"}],
)
# The model calls /api/search/web, gets clean ranked snippets back,
# and answers with citations — no SERP parser anywhere in the loop.

Đó chính là toàn bộ ý nghĩa của danh mục này: API tìm kiếm gặp agent ngay tại nơi nó đã ở đó, nên đoạn code keo dán từng nằm trong codebase của bạn nay được dời ra sau endpoint.

Vậy bạn nên dùng cái nào?

Dùng SERP scraping khi…

Bạn cần chính trang kết quả — thứ hạng tự nhiên chính xác để giám sát SEO, knowledge panel, local pack, shopping — hoặc bạn đã vận hành một bộ trích xuất nội dung và muốn truy vấn thô rẻ nhất. Serper và SerpApi được xây cho việc này.

Dùng agentic search khi…

Bạn đang căn cứ câu trả lời của một LLM bên trong một agent và muốn văn bản sạch, đã xếp hạng, có thể trích dẫn mà không phải xây một lớp làm sạch — và lý tưởng nhất là tính phí trả-theo-mức-dùng, chỉ khi thành công để những lần thử lại là miễn phí. Đó chính xác là những gì API Pick Web Search làm: 15 credit (~$0.015) mỗi lượt gọi, bộ lọc quốc gia và ngày, chỉ tính phí trên HTTP 200, kèm một tool schema OpenAI/Claude dán-là-chạy. Dùng thử →

Câu hỏi thường gặp

Agentic search là gì?

Agentic search là tìm kiếm web được xây để một AI agent tiêu thụ thay vì hiển thị cho con người. Bạn gửi một truy vấn hoặc một mục tiêu ngữ nghĩa, và API trả về một danh sách ngắn, đã xếp hạng gồm tiêu đề, URL và các đoạn văn bản đã được làm sạch sẵn — đôi khi là một câu trả lời hoàn chỉnh kèm trích dẫn — vốn đã được định dạng để đưa thẳng vào cửa sổ ngữ cảnh của mô hình ngôn ngữ. Nó tương phản với SERP scraping, thứ trả về trang kết quả thô mà một con người sẽ nhìn thấy.

Agentic search khác với một API SERP như thế nào?

Một API SERP (như Serper hoặc SerpApi) trả về toàn bộ JSON của một trang kết quả tìm kiếm: liên kết tự nhiên, quảng cáo, knowledge panel, local pack — bố cục hướng tới con người — và bạn tự lo việc làm sạch, xếp hạng và trích xuất snippet. Một API agentic search (như Exa, Tavily, Linkup hay API Pick) bỏ qua hoàn toàn SERP và trả về văn bản sạch, đã xếp hạng, sẵn sàng cho LLM. Các API SERP tối ưu cho độ trung thực với Google; agentic search tối ưu cho việc mô hình dùng trực tiếp.

Vì sao agentic search xuất hiện vào giai đoạn 2025–2026?

Hai lực đẩy. Thứ nhất, LLM suy luận kém trên một khối SERP thô nhưng tốt trên các đoạn ngắn, có tên, đã xếp hạng — nên một định dạng dành cho con người trở thành gánh nặng cho agent. Thứ hai, Microsoft ngừng Bing Search API vào ngày 11 tháng 8 năm 2025, vốn âm thầm cung cấp phần lớn hệ sinh thái grounding cho LLM, buộc hàng nghìn đội ngũ phải chọn lại nhà cung cấp đúng lúc các startup thuần agent (Exa, Tavily, Linkup, Parallel) ra mắt các API thiết kế cho tình huống sử dụng mới.

Agentic search có phải chỉ là RAG không?

Không hẳn. RAG (retrieval-augmented generation) là mô thức tổng quát của việc căn cứ câu trả lời của LLM vào các tài liệu được truy xuất. Agentic search là một cách để làm nửa phần truy xuất — cụ thể là truy xuất web trực tiếp được định hình cho một agent. Bạn có thể xây RAG trên một cơ sở dữ liệu vector riêng tư mà không cần tìm kiếm web nào, và bạn có thể dùng agentic search mà không cần RAG cổ điển. Chúng phối hợp tốt với nhau, nhưng là những lớp khác nhau.

Khi nào tôi vẫn nên dùng một API SERP scraping?

Hãy dùng một API SERP khi pipeline của bạn thực sự cần cấu trúc trang kết quả của Google — thứ hạng tự nhiên chính xác để giám sát SEO, knowledge-graph panel, local/maps pack, kết quả shopping — hoặc khi bạn đã vận hành một bộ trích xuất nội dung và muốn truy vấn thô rẻ nhất. Để căn cứ câu trả lời của LLM, một API agentic search trả về văn bản sạch sẽ loại bỏ cả một bước làm sạch.

Agentic search có đắt hơn SERP scraping không?

Tính theo mỗi truy vấn thô, SERP scraping thường rẻ hơn (Serper vào khoảng $0,30–$1 cho mỗi 1.000 lượt). Các API agentic search tính phí cao hơn mỗi lượt gọi (~$5–$16 cho mỗi 1.000 lượt) vì chúng còn làm sạch, xếp hạng và định hình văn bản — công việc mà nếu không thì bạn sẽ phải trả trong bước trích xuất của riêng mình và thời gian kỹ thuật. Một khi bạn tính chi phí toàn bộ pipeline, khoảng cách thu hẹp lại; và cách tính phí chỉ khi thành công (ví dụ API Pick với 15 credit cho mỗi HTTP 200) loại bỏ hoàn toàn chi phí của những lần agent thử lại.

Các API dùng trong bài viết này

Tìm kiếm Web

Tìm kiếm web ngữ nghĩa thời gian thực được xây dựng cho LLM tool calling. Trả về tiêu đề, URL và đoạn trích sạch đã xếp hạng, định hình sẵn cho agent tiêu thụ. Hỗ trợ lọc theo quốc gia và ngày.

Trích xuất nội dung URL

Trích xuất nội dung sạch, dễ đọc từ tối đa 25 URL mỗi lượt gọi. Loại bỏ quảng cáo, điều hướng và mã rác; trả về văn bản dạng markdown sẵn sàng cho LLM. 2 credit mỗi URL.

Tìm kiếm Tin tức

Tìm kiếm tin tức thời gian thực trên các hãng tin lớn. Lọc theo khoảng ngày và quốc gia cho truy vấn nhạy cảm về thời gian. Xây dựng cho bản tin buổi sáng, agent tin tức thị trường và pipeline RAG.

Viết bởi

Sarah Choy

CEO, API Pick

Sarah Choy là CEO của API Pick. Cô viết về việc xây dựng các API sẵn sàng cho production cho AI agent và quy trình LLM.