[ blog · deep-dive ]10 min read

Agentic Search vs SERP-Scraping: Warum Agenten eine andere API brauchen

Sarah ChoyVeröffentlicht am 29. Mai 202610 Min. Lesezeit

Zwanzig Jahre lang hieß eine Search-API: 'scrape Googles Ergebnisseite'. AI-Agenten haben diese Annahme gebrochen. Hier ist, was Agentic Search wirklich ist, warum es entstand und wann das alte SERP-Modell weiterhin Sinn ergibt.

Auf einen Blick

•Agentic Search ist Web-Suche, die dafür gebaut ist, von einem AI-Agenten konsumiert zu werden: Du schickst ein semantisches Ziel und bekommst eine kurze, geordnete Liste aus sauberen, zitierbaren Textpassagen in passender Größe für ein Context Window zurück.
•SERP-Scraping liefert das rohe HTML/JSON einer Suchmaschinen-Ergebnisseite — gebaut für Menschen und Dashboards, nicht für Sprachmodelle.
•Der Wandel geschah, weil LLMs über kurzen geordneten Text reasoning machen, nicht über einen SERP-Blob, und weil Microsoft die Bing Search API im August 2025 eingestellt hat, was eine marktweite Neu-Auswahl erzwang.
•Agentic Search fügt drei Dinge hinzu, die SERP-APIs fehlen: vorab gereinigte Snippets, optionale gegroundete Antworten und agentenfreundliche Abrechnung (pro Aufruf, oft nur bei Erfolg).
•SERP-Scraping gewinnt weiterhin, wenn du wirklich Googles vollständige Ergebnisseite brauchst — Rankings, Knowledge Panels, Local Packs — und deine eigene Aufbereitungs-Pipeline betreibst.

Eine Definition vorweg

Agentic Search ist Web-Suche, die dafür gebaut ist, von einem AI-Agenten konsumiert statt einem Menschen angezeigt zu werden. Du schickst eine Query — oder ein höherstufiges semantisches Ziel — und bekommst eine kurze, geordnete Liste aus Titeln, URLs und vorab gereinigten Textpassagen zurück, manchmal eine fertige zitierte Antwort, bereits so geformt, dass sie in das Context Window eines Sprachmodells fällt.

Das ist ein anderes Produkt als das, was „eine Search-API" in den vorangegangenen zwanzig Jahren bedeutete. Zwei Jahrzehnte lang hieß eine Search-API: Gib mir die Ergebnisseite, die ein Mensch sehen würde. Genau diese Annahme haben AI-Agenten gebrochen.

Das alte Modell: SERP-Scraping

Eine SERP-API (Search Engine Results Page) liefert das strukturierte JSON einer Google- oder Bing-Ergebnisseite — organische Links, das Knowledge Panel, „people also ask", Local Packs, Anzeigen, Shopping-Karussells. Tools wie Serper und SerpApi machen das extrem gut und günstig. Der Output ist treu zu dem, was eine Person im Browser sieht:

{
  "organic": [
    { "position": 1, "title": "…", "link": "https://…", "snippet": "…" },
    { "position": 2, "title": "…", "link": "https://…", "snippet": "…" }
  ],
  "knowledgeGraph": { "title": "…", "type": "…", "description": "…" },
  "peopleAlsoAsk": [ /* … */ ],
  "relatedSearches": [ /* … */ ]
}

Das ist perfekt für ein SEO-Dashboard, einen Rank-Tracker oder ein Human-in-the-Loop-Recherchetool. Es ist die falsche Form für ein Sprachmodell, aus einem schlichten Grund: Ein Modell kann nicht effektiv über einen SERP-Blob reasoning machen. Es macht Reasoning über kurzen, benannten, geordneten Text. Reichst du einem Modell eine vollständige SERP, gibst du Kontext-Token für Layout-Metadaten, Anzeigen und „related searches" aus, die nichts mit der Antwort zu tun haben.

Das neue Modell: Agentic Search

Agentic Search wirft die SERP weg und liefert nur, was ein Agent nutzen kann. Dieselbe Query kommt als kompakte, geordnete Liste aus sauberen Passagen zurück:

{
  "results": [
    {
      "title": "Retrieval-augmented generation - Wikipedia",
      "url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
      "snippet": "Retrieval-augmented generation (RAG) combines search with\ntext generation, grounding LLM answers in retrieved documents."
    }
    /* …4 more, ranked */
  ],
  "result_count": 5,
  "credits_used": 15
}

Diese Form kodiert drei bewusste Entscheidungen, die eine SERP-API dir überlässt:

Vorab gereinigte Snippets. Der Boilerplate — Navigation, Cookie-Banner, Anzeigen — ist entfernt, sodass das Modell seinen Kontext für das Signal ausgibt.
Ranking nach Relevanz, nicht nach Anzeigen. Ergebnisse werden nach Nützlichkeit für die Query geordnet, nicht nach einem Ergebnisseiten-Layout, das die obersten Plätze monetarisiert.
Ein Größenbudget. Eine Handvoll Ergebnisse, nicht hundert, weil Context Windows und Token-Budgets endlich sind.

Warum der Wandel jetzt geschah

Zwei Kräfte kamen 2025–2026 zusammen.

1. LLMs machten das SERP-Format zur Belastung

Sobald Agenten begannen, Suche als Tool aufzurufen, wurde das Missverhältnis offensichtlich. Jeder Token, der für SERP-Gerüst ausgegeben wird, ist ein Token, der nicht für die eigentlichen Quellen ausgegeben wird, und jede ungereinigte Seite ist ein Ort, an dem sich das Modell ablenken lassen oder einen Cookie-Banner zitieren kann. Teams fanden sich dabei wieder, eine Reinigungs- und Ranking-Schicht auf jede SERP-API zu schreiben — genau die Schicht, die Agentic Search einbaut.

2. Bings Einstellung erzwang eine Neu-Auswahl

Am 11. August 2025 stellte Microsoft die Bing-Search-APIs ein und schaltete die Endpoints ab, die still einen großen Teil der LLM-Pipelines gegroundet hatten. Der Ersatz — Grounding with Bing Search innerhalb von Azure AI Foundry — ist keine Drop-in-API und rechnet mit rund $35 pro 1.000 Transaktionen ab. Tausende Teams mussten genau in dem Moment einen neuen Anbieter wählen, als eine Welle agenten-nativer Startups auf den Markt kam: Exa sammelte eine $85M Series B ein, Parallel sammelte $100M ein, Tavily wurde von Nebius für $275M übernommen, Linkup sammelte einen Seed ein. Die Kategorie erschien nicht einfach — sie wurde finanziert und ins Offene gedrängt.

SERP-Scraping vs Agentic Search: die ehrliche Tabelle

Pro Query ist SERP-Scraping günstiger; sobald du die Aufbereitungsschicht hinzuzählst, die Agentic Search enthält, schließt sich die Gesamtkostenlücke. Preise sind Listenwerte von 2026 — prüfe sie auf der Seite jedes Anbieters.

	SERP-Scraping	Agentic Search
Liefert	Rohes Ergebnisseiten-JSON	Geordnete, saubere, LLM-fertige Snippets
Gebaut für	Menschen, Dashboards, Rank-Tracking	AI-Agenten, RAG, Tool-Calling
Aufbereitungsschritt	Baust du selbst	Inklusive
Token-Effizienz	Niedrig (Layout + Anzeigen im Payload)	Hoch (nur Signal)
Antwort-Modus	Nein	Oft (gebündelt oder separater /answer)
Roh-Preis / 1k	~$0.30–$1	~$5–$16
Gesamt-Pipeline-Preis	+ dein Extractor + Eng-Zeit	Näher, als es aussieht
Bestes Einsatzfeld	SEO, SERP-Features, eigene Pipelines	LLM-Antworten in einem Agenten grounden

Die Ökonomie, die niemand auf die Preisseite schreibt

Der Preisschock — „Agentic Search kostet das 10-Fache von Serper" — verschwindet, sobald du die gesamte Pipeline bepreist. Eine SERP-API gibt dir eine Ergebnisseite; um ein Modell zu füttern, führst du danach einen Content-Extractor auf den gewählten Links aus, plus die Entwicklung, um die Reinigungs- und Ranking-Logik zu bauen und zu pflegen. Agentic Search faltet das in den Aufruf. Du zahlst nicht das 10-Fache für dasselbe; du zahlst einmal für zwei Schritte statt zweimal für zwei Schritte.

Es gibt eine zweite, heimtückischere Kostenquelle: Retries. Agenten fächern aus und versuchen bei vorübergehenden Fehlern erneut. Bei einem Pro-Query-SERP-Abrechner ist jeder Retry abrechenbar. Die sauberste Verteidigung ist die Abrechnung nur bei Erfolg — du zahlst für die HTTP 200, nicht für die drei Timeouts davor. Für burstigen Agenten-Traffic spart diese eine Abrechnungsregel oft mehr als der Pro-Aufruf-Preisunterschied zwischen Anbietern.

Auf Agentic Search aufbauen: der minimale Loop

Weil der Output bereits modell-geformt ist, ist die Integration kurz. Zieh ein Tool-Schema, reich es deinem Modell und lass es Suche als Tool aufrufen:

import anthropic, requests

# Agentic search ships a ready-made tool definition — no hand-written JSON
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[schema["claude"]],
    messages=[{"role": "user", "content": "What is agentic search, with sources?"}],
)
# The model calls /api/search/web, gets clean ranked snippets back,
# and answers with citations — no SERP parser anywhere in the loop.

Das ist der ganze Sinn der Kategorie: Die Search-API trifft den Agenten dort, wo er ohnehin schon ist, sodass der Glue-Code, der früher in deiner Codebasis lebte, hinter den Endpoint wandert.

Also welches solltest du nutzen?

SERP-Scraping nutzen, wenn…

Du die Ergebnisseite selbst brauchst — exakte organische Rankings fürs SEO-Monitoring, Knowledge Panels, Local Packs, Shopping — oder du bereits einen Content-Extractor betreibst und die günstigste rohe Query willst. Serper und SerpApi sind dafür gebaut.

Agentic Search nutzen, wenn…

Du die Antwort eines LLM innerhalb eines Agenten groundest und sauberen, geordneten, zitierbaren Text willst, ohne eine Aufbereitungsschicht zu bauen — und idealerweise Pay-as-you-go mit Abrechnung nur bei Erfolg, sodass Retries gratis sind. Genau das macht API Pick Web Search: 15 Credits (≈ $0.015) pro Aufruf, Land- und Datumsfilter, Abrechnung nur bei HTTP 200, mit einem fertig einfügbaren OpenAI-/Claude-Tool-Schema. Jetzt testen →

Häufig gestellte Fragen

Was ist Agentic Search?

Agentic Search ist Web-Suche, die dafür gebaut ist, von einem AI-Agenten konsumiert statt einem Menschen angezeigt zu werden. Du schickst eine Query oder ein semantisches Ziel, und die API liefert eine kurze, geordnete Liste aus Titeln, URLs und vorab gereinigten Textauszügen zurück — manchmal eine fertige zitierte Antwort — bereits so geformt, dass sie in das Context Window eines Sprachmodells fällt. Es steht im Kontrast zum SERP-Scraping, das die rohe Ergebnisseite liefert, die ein Mensch sehen würde.

Wie unterscheidet sich Agentic Search von einer SERP-API?

Eine SERP-API (wie Serper oder SerpApi) liefert das vollständige JSON einer Suchmaschinen-Ergebnisseite: organische Links, Anzeigen, Knowledge Panels, Local Packs — das menschen-zugewandte Layout — und du übernimmst Reinigung, Ranking und Snippet-Extraktion selbst. Eine Agentic-Search-API (wie Exa, Tavily, Linkup oder API Pick) überspringt die SERP vollständig und liefert sauberen, geordneten, LLM-fertigen Text. SERP-APIs optimieren auf Treue zu Google; Agentic Search optimiert auf die direkte Nutzung durch ein Modell.

Warum entstand Agentic Search 2025–2026?

Zwei Kräfte. Erstens machen LLMs schlechtes Reasoning über einen rohen SERP-Blob, aber gutes über kurze, benannte, geordnete Passagen — also wurde ein Format, das für Menschen gebaut war, zur Belastung für Agenten. Zweitens stellte Microsoft die Bing Search API am 11. August 2025 ein, die still einen großen Teil des LLM-Grounding-Ökosystems angetrieben hatte, und zwang Tausende Teams zur Neu-Auswahl eines Anbieters — genau in dem Moment, als agenten-native Startups (Exa, Tavily, Linkup, Parallel) APIs für den neuen Anwendungsfall auf den Markt brachten.

Ist Agentic Search einfach nur RAG?

Nicht ganz. RAG (Retrieval-Augmented Generation) ist das übergreifende Muster, die Antwort eines LLM in abgerufenen Dokumenten zu grounden. Agentic Search ist eine Art, die Retrieval-Hälfte zu erledigen — konkret Live-Web-Retrieval, geformt für einen Agenten. Du kannst RAG über eine private Vektordatenbank ganz ohne Web-Suche bauen, und du kannst Agentic Search ohne klassisches RAG nutzen. Sie kombinieren sich gut, aber sie sind unterschiedliche Schichten.

Wann sollte ich weiterhin eine SERP-Scraping-API nutzen?

Nutze eine SERP-API, wenn deine Pipeline wirklich die Struktur von Googles Ergebnisseite braucht — exakte organische Rankings für SEO-Monitoring, Knowledge-Graph-Panels, Local-/Maps-Packs, Shopping-Ergebnisse — oder wenn du bereits einen Content-Extractor betreibst und die günstigste rohe Query willst. Fürs Grounding einer LLM-Antwort entfernt eine Agentic-Search-API, die sauberen Text liefert, einen ganzen Aufbereitungsschritt.

Kostet Agentic Search mehr als SERP-Scraping?

Pro roher Query ist SERP-Scraping meist günstiger (Serper liegt grob bei $0.30–$1 pro 1.000). Agentic-Search-APIs verlangen mehr pro Aufruf (~$5–$16 pro 1.000), weil sie den Text zusätzlich reinigen, ranken und formen — Arbeit, die du sonst in deinem eigenen Extraktionsschritt und in Entwicklerzeit bezahlst. Sobald du die gesamte Pipeline bepreist, schließt sich die Lücke; und Abrechnung nur bei Erfolg (z. B. API Pick mit 15 Credits pro HTTP 200) entfernt die Kosten von Agenten-Retries vollständig.

APIs in diesem Artikel

Websuche

Echtzeit-Semantik-Websuche, gebaut für LLM-Tool-Calling. Liefert geordnete Titel, URLs und saubere Snippets, vorformatiert für Agenten-Konsum. Länder- und Datumsfilter unterstützt.

URL-Content-Extract

Extrahiert sauberen, lesbaren Content aus bis zu 25 URLs pro Aufruf. Entfernt Werbung, Navigation und Boilerplate; liefert markdown-ähnlichen Text bereit für LLM-Aufnahme. 2 Credits pro URL.

Nachrichtensuche

Echtzeit-Nachrichtensuche über große Medien hinweg. Datums- und Länderfilter für zeitkritische Anfragen. Gebaut für Morgen-Briefings, Marktnachrichten-Agenten und RAG-Pipelines.

Geschrieben von

Sarah Choy

CEO, API Pick

Sarah Choy ist CEO von API Pick. Sie schreibt über produktionsreife APIs für KI-Agenten und LLM-Workflows.