[ blog · deep-dive ]10 min read

Wyszukiwanie agentowe a scraping SERP: dlaczego agenci potrzebują innego API

Sarah ChoyOpublikowano 29 maja 202610 min czytania
Wyszukiwanie agentowe a scraping SERP: dlaczego agenci potrzebują innego API

Przez dwadzieścia lat „API wyszukiwania” znaczyło „zescrapuj stronę wyników Google”. Agenci AI obalili to założenie. Oto czym naprawdę jest wyszukiwanie agentowe, dlaczego się pojawiło i kiedy stary model SERP wciąż ma sens.

TL;DR

  • Wyszukiwanie agentowe to wyszukiwanie w sieci zaprojektowane do konsumpcji przez agenta AI: wysyłasz cel semantyczny i otrzymujesz krótką, uszeregowaną listę czystych, cytowalnych fragmentów tekstu dopasowanych do okna kontekstu.
  • Scraping SERP zwraca surowy HTML/JSON strony wyników wyszukiwarki — zbudowany dla ludzi i dashboardów, nie dla modeli językowych.
  • Zmiana nastąpiła, ponieważ LLM-y rozumują nad krótkim, uszeregowanym tekstem, a nie nad blobem SERP, oraz dlatego, że Microsoft wycofał Bing Search API w sierpniu 2025 roku, zmuszając cały rynek do ponownego wyboru.
  • Wyszukiwanie agentowe dodaje trzy rzeczy, których brakuje API SERP: wstępnie oczyszczone snippety, opcjonalne ugruntowane odpowiedzi oraz rozliczanie przyjazne agentom (za wywołanie, często tylko przy sukcesie).
  • Scraping SERP nadal wygrywa, gdy naprawdę potrzebujesz pełnej strony wyników Google — rankingów, paneli wiedzy, pakietów lokalnych — i prowadzisz własny potok czyszczenia.

Definicja na wstępie

Wyszukiwanie agentowe to wyszukiwanie w sieci zaprojektowane do konsumpcji przez agenta AI, a nie do wyświetlenia człowiekowi. Wysyłasz zapytanie — lub cel semantyczny wyższego rzędu — i otrzymujesz w zamian krótką, uszeregowaną listę tytułów, adresów URL i wstępnie oczyszczonych fragmentów tekstu, czasem gotową odpowiedź z cytowaniami, już uformowaną tak, by trafiła do okna kontekstu modelu językowego.

To inny produkt niż to, czym „API wyszukiwania” było przez poprzednie dwadzieścia lat. Przez dwie dekady API wyszukiwania znaczyło: daj mi stronę wyników, jaką zobaczyłby człowiek. To właśnie założenie obalili agenci AI.

Stary model: scraping SERP

API SERP (search engine results page) zwraca ustrukturyzowany JSON strony wyników Google lub Bing — linki organiczne, panel wiedzy, „people also ask”, pakiety lokalne, reklamy, karuzele zakupowe. Narzędzia jak Serper i SerpApi robią to niezwykle dobrze i tanio. Wynik jest wierny temu, co człowiek widzi w przeglądarce:

{
  "organic": [
    { "position": 1, "title": "…", "link": "https://…", "snippet": "…" },
    { "position": 2, "title": "…", "link": "https://…", "snippet": "…" }
  ],
  "knowledgeGraph": { "title": "…", "type": "…", "description": "…" },
  "peopleAlsoAsk": [ /* … */ ],
  "relatedSearches": [ /* … */ ]
}

To idealne dla dashboardu SEO, trackera rankingów albo narzędzia badawczego z człowiekiem w pętli. To zły kształt dla modelu językowego, z jednego dosadnego powodu: model nie potrafi skutecznie rozumować nad blobem SERP. Rozumuje nad krótkim, nazwanym, uszeregowanym tekstem. Podaj modelowi pełny SERP, a wydajesz tokeny kontekstu na metadane układu, reklamy i „related searches”, które nie mają nic wspólnego z odpowiedzią.

Nowy model: wyszukiwanie agentowe

Wyszukiwanie agentowe wyrzuca SERP i zwraca tylko to, czego agent może użyć. To samo zapytanie wraca jako zwarta, uszeregowana lista czystych fragmentów:

{
  "results": [
    {
      "title": "Retrieval-augmented generation - Wikipedia",
      "url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
      "snippet": "Retrieval-augmented generation (RAG) combines search with\ntext generation, grounding LLM answers in retrieved documents."
    }
    /* …4 more, ranked */
  ],
  "result_count": 5,
  "credits_used": 15
}

Ten kształt koduje trzy zamierzone decyzje, które API SERP pozostawia Tobie:

  • Wstępnie oczyszczone snippety. Balast — nawigacja, banery cookies, reklamy — jest usuwany, więc model wydaje swój kontekst na sygnał.
  • Szeregowanie pod trafność, nie pod reklamy. Wyniki są uporządkowane według przydatności dla zapytania, a nie według układu strony wyników monetyzującego górne miejsca.
  • Budżet rozmiaru. Garść wyników, nie setka, ponieważ okna kontekstu i budżety tokenów są skończone.

Dlaczego zmiana nastąpiła właśnie teraz

W latach 2025–2026 zbiegły się dwie siły.

1. LLM-y uczyniły z formatu SERP obciążenie

Gdy tylko agenci zaczęli wywoływać wyszukiwanie jako narzędzie, niedopasowanie stało się oczywiste. Każdy token wydany na rusztowanie SERP to token niewydany na rzeczywiste źródła, a każda nieoczyszczona strona to miejsce, w którym model może się rozproszyć albo zacytować baner cookies. Zespoły odkryły, że piszą warstwę czyszczenia i szeregowania na każdym API SERP — czyli dokładnie tę warstwę, którą wyszukiwanie agentowe ma wbudowaną.

2. Wycofanie Bing wymusiło ponowny wybór

11 sierpnia 2025 roku Microsoft wycofał Bing Search API, likwidując endpointy, które po cichu ugruntowywały dużą część potoków LLM. Zamiennik — Grounding with Bing Search wewnątrz Azure AI Foundry — nie jest API typu drop-in i kosztuje około 35 USD za 1000 transakcji. Tysiące zespołów musiało wybrać nowego dostawcę dokładnie w chwili, gdy wystartowała fala startupów natywnych dla agentów: Exa pozyskała rundę Series B na 85 mln USD, Parallel pozyskało 100 mln USD, Tavily zostało przejęte przez Nebius za 275 mln USD, Linkup pozyskało rundę seed. Kategoria nie pojawiła się ot tak — została sfinansowana i wypchnięta na światło dzienne.

Scraping SERP a wyszukiwanie agentowe: szczera tabela

Za zapytanie scraping SERP jest tańszy; gdy dodasz warstwę czyszczenia, którą wyszukiwanie agentowe ma wliczoną, różnica w całkowitym koszcie maleje. Ceny to stawki cennikowe z 2026 roku — potwierdź na stronie każdego dostawcy.
Scraping SERPWyszukiwanie agentowe
ZwracaSurowy JSON strony wynikówUszeregowane, czyste, gotowe dla LLM snippety
Zbudowane dlaLudzi, dashboardów, trackingu rankingówAgentów AI, RAG, tool calling
Krok czyszczeniaBudujesz samWliczony
Efektywność tokenówNiska (układ + reklamy w payloadzie)Wysoka (sam sygnał)
Tryb odpowiedziNieCzęsto (dołączony lub osobny /answer)
Cena surowa / 1k~$0.30–$1~$5–$16
Cena całego potoku+ Twój ekstraktor + czas inżynierskiBliżej, niż się wydaje
Najlepsze doSEO, funkcji SERP, własnych potokówUgruntowywania odpowiedzi LLM w agencie

Ekonomia, której nikt nie umieszcza na stronie cennika

Szok cenowy — „wyszukiwanie agentowe jest 10x droższe od Serpera” — znika, gdy wycenisz cały potok. API SERP daje Ci stronę wyników; aby nakarmić model, uruchamiasz następnie ekstraktor treści na wybranych linkach, plus inżynierię do zbudowania i utrzymania logiki czyszczenia i szeregowania. Wyszukiwanie agentowe składa to w jedno wywołanie. Nie płacisz 10x za to samo; płacisz raz za dwa kroki, zamiast dwa razy za dwa kroki.

Jest jeszcze drugi, bardziej podstępny koszt: ponowne próby. Agenci rozgałęziają się i ponawiają przy przejściowych awariach. Przy rozliczaniu SERP za zapytanie każda ponowna próba jest płatna. Najczystszą obroną jest rozliczanie tylko przy sukcesie — płacisz za HTTP 200, a nie za trzy timeouty przed nim. Przy zrywowym ruchu agentów sama ta zasada rozliczania często oszczędza więcej niż różnica w cenie za wywołanie między dostawcami.

Budowanie na wyszukiwaniu agentowym: minimalna pętla

Ponieważ wynik jest już uformowany pod model, integracja jest krótka. Pobierz schemat narzędzia, przekaż go swojemu modelowi i pozwól mu wywołać wyszukiwanie jako narzędzie:

import anthropic, requests

# Agentic search ships a ready-made tool definition — no hand-written JSON
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[schema["claude"]],
    messages=[{"role": "user", "content": "What is agentic search, with sources?"}],
)
# The model calls /api/search/web, gets clean ranked snippets back,
# and answers with citations — no SERP parser anywhere in the loop.

Na tym polega cały sens tej kategorii: API wyszukiwania spotyka agenta tam, gdzie już jest, więc kod klejowy, który kiedyś mieszkał w Twoim codebase, przenosi się za endpoint.

Więc czego powinieneś użyć?

Użyj scrapingu SERP, gdy…
Potrzebujesz samej strony wyników — dokładnych rankingów organicznych do monitoringu SEO, paneli wiedzy, pakietów lokalnych, zakupów — albo już prowadzisz ekstraktor treści i chcesz najtańsze surowe zapytanie. Serper i SerpApi są do tego stworzone.
Użyj wyszukiwania agentowego, gdy…
Ugruntowujesz odpowiedź LLM wewnątrz agenta i chcesz czysty, uszeregowany, cytowalny tekst bez budowania warstwy czyszczenia — a najlepiej rozliczanie pay-as-you-go, tylko przy sukcesie, by ponowne próby były darmowe. To dokładnie robi API Pick Web Search: 15 kredytów (~$0.015) za wywołanie, filtry kraju i daty, naliczane tylko przy HTTP 200, z gotowym do wklejenia schematem narzędzia OpenAI/Claude.Wypróbuj →

Najczęściej zadawane pytania

Czym jest wyszukiwanie agentowe?

Wyszukiwanie agentowe to wyszukiwanie w sieci zbudowane do konsumpcji przez agenta AI, a nie do wyświetlenia człowiekowi. Wysyłasz zapytanie lub cel semantyczny, a API zwraca krótką, uszeregowaną listę tytułów, adresów URL i wstępnie oczyszczonych fragmentów tekstu — czasem gotową odpowiedź z cytowaniami — już uformowaną tak, by trafiła do okna kontekstu modelu językowego. Stanowi to przeciwieństwo scrapingu SERP, który zwraca surową stronę wyników, jaką zobaczyłby człowiek.

Czym wyszukiwanie agentowe różni się od API SERP?

API SERP (jak Serper czy SerpApi) zwraca pełny JSON strony wyników wyszukiwarki: linki organiczne, reklamy, panele wiedzy, pakiety lokalne — układ zorientowany na człowieka — a czyszczenie, szeregowanie i ekstrakcję snippetów wykonujesz sam. API wyszukiwania agentowego (jak Exa, Tavily, Linkup czy API Pick) całkowicie pomija SERP i zwraca czysty, uszeregowany, gotowy dla LLM tekst. API SERP optymalizują pod wierność wobec Google; wyszukiwanie agentowe optymalizuje pod bezpośrednie użycie przez model.

Dlaczego wyszukiwanie agentowe pojawiło się w latach 2025–2026?

Dwie siły. Po pierwsze, LLM-y słabo rozumują nad surowym blobem SERP, a dobrze nad krótkimi, nazwanymi, uszeregowanymi fragmentami — więc format zbudowany dla ludzi stał się obciążeniem dla agentów. Po drugie, Microsoft wycofał Bing Search API 11 sierpnia 2025 roku, które po cichu zasilało dużą część ekosystemu ugruntowywania LLM, zmuszając tysiące zespołów do ponownego wyboru dostawcy dokładnie w chwili, gdy startupy natywne dla agentów (Exa, Tavily, Linkup, Parallel) wypuściły API zaprojektowane pod nowe zastosowanie.

Czy wyszukiwanie agentowe to po prostu RAG?

Nie do końca. RAG (retrieval-augmented generation) to ogólny wzorzec ugruntowywania odpowiedzi LLM w pobranych dokumentach. Wyszukiwanie agentowe to jeden ze sposobów realizacji połowy pobierającej — konkretnie pobierania na żywo z sieci uformowanego dla agenta. Możesz zbudować RAG na prywatnej bazie wektorowej bez żadnego wyszukiwania w sieci i możesz używać wyszukiwania agentowego bez klasycznego RAG. Dobrze się łączą, ale są różnymi warstwami.

Kiedy nadal powinienem używać API do scrapingu SERP?

Używaj API SERP, gdy Twój potok naprawdę potrzebuje struktury strony wyników Google — dokładnych rankingów organicznych do monitoringu SEO, paneli grafu wiedzy, pakietów lokalnych/map, wyników zakupów — albo gdy już prowadzisz ekstraktor treści i chcesz najtańsze surowe zapytanie. Do ugruntowania odpowiedzi LLM API wyszukiwania agentowego zwracające czysty tekst usuwa cały krok czyszczenia.

Czy wyszukiwanie agentowe kosztuje więcej niż scraping SERP?

Za surowe zapytanie scraping SERP jest zwykle tańszy (Serper to około 0,30–1 USD za 1000). API wyszukiwania agentowego pobierają więcej za wywołanie (~5–16 USD za 1000), bo dodatkowo czyszczą, szeregują i formują tekst — pracę, za którą inaczej zapłaciłbyś we własnym kroku ekstrakcji i w czasie inżynierskim. Gdy wycenisz cały potok, różnica maleje; a rozliczanie tylko przy sukcesie (np. API Pick za 15 kredytów na każde HTTP 200) całkowicie eliminuje koszt ponownych prób agenta.

API użyte w tym artykule

Sarah Choy
Autor
Sarah Choy
CEO, API Pick

Sarah Choy jest CEO API Pick. Pisze o budowaniu produkcyjnych API dla agentów AI i przepływów pracy z LLM.