[ blog · comparison ]9 min read

Tavily vs Exa vs Serper vs API Pick: Welche Web-Search-API für LLMs?

Sarah ChoyVeröffentlicht am 2. Mai 2026Aktualisiert am 3. Mai 20269 Min. Lesezeit

Tavily, Exa, Serper und API Pick wollen alle die Suchschicht für dein LLM sein. In Output-Form, Filtern und Abrechnung unterscheiden sie sich deutlich. Hier ein direkter Vergleich aus der Praxis.

Auf einen Blick

•Gehosteter RAG-Endpoint, der LLM-fertige Antworten liefert? Tavily — auf Kosten von intransparentem Ranking und Monatsmindestbeitrag.
•Semantik-zuerst, Frische weniger wichtig? Exa — Budget bei großem Volumen einplanen.
•Rohe Google SERPs, eigene Aufbereitung? Serper.
•Vorgeformtes JSON, transparente Pro-Aufruf-Abrechnung, Land- und Datumsfilter, nur HTTP 200 wird abgerechnet? API Pick Web Search.

Was 'Web-Search-API für LLMs' wirklich bedeutet

Allgemeine Such-APIs (Google Custom Search, Bing Web Search, SerpAPI) liefern eine SERP — die blauen Links und Rich Snippets, die ein Mensch im Browser sieht. Für ein Sprachmodell ist das die falsche Form. Ein Agent will keine SERP parsen, sondern eine kompakte ranked Liste aus Title, URL und sauberen Textauszügen, die direkt ins Context Window passen. Alle vier APIs versprechen das, gehen es aber unterschiedlich an.

Wir vergleichen entlang fünf praxisrelevanter Achsen: Output-Form, Filter, Preismodell, Integrationsergonomie und was sie nicht abdecken.

Die Kandidaten in einem Absatz

Tavily

Gehosteter RAG-Service. tavily.search liefert ranked Snippets, tavily.qna kombiniert Suche mit einer leichten LLM-Antwort. Stark, wenn man dem Modell direkt einen 'antwortfertigen Blob' geben will. Abo + Credits.

Exa (vormals Metaphor)

Neuronaler / semantischer Index. Rund um 'finde URLs, die diesem ähneln' und Embedding-Ranking gebaut, optional Highlights oder Volltext. Stark, wenn Frische weniger zählt als thematische Ähnlichkeit. Abo + Überzahlung.

Serper

Rohe Google-SERP-API. Liefert die JSON-Form einer realen Google-Ergebnisseite (organic, knowledge graph, places, videos). Snippet-Aufbereitung und Ranking machst du selbst. Pro Query günstig, aber die LLM-Aufbereitungsschicht baust du.

API Pick Web Search

Pay-as-you-go semantische Web-Search, vorgeformt für LLM-Tool-Calling. POST /api/search/web liefert standardmäßig 5 (max 10) ranked Ergebnisse mit Title, URL und LLM-freundlichem Snippet, optional country_code und start_date/end_date. 15 Credits pro Aufruf (≈ $0.015), nur bei Erfolg abgerechnet.

Direktvergleich

Tabelle zeigt die generelle Positionierung zum Zeitpunkt der Veröffentlichung. Vor der Integration aktuelle Preise und Kontingente auf den Anbieterseiten prüfen.

	Tavily	Exa	Serper	API Pick
Output-Form	ranked Snippets + optional LLM-Antwort	ranked URLs + optional Highlights / Inhalt	rohe Google-SERP-JSON	ranked title + URL + LLM-freundliches Snippet
Land-Filter	Ja	Eingeschränkt	Ja	Ja (country_code)
Datum-Filter	Ja	Ja	Ja (qdr)	Ja (start_date / end_date)
Tool-Schema-Endpoint	—	—	—	Ja — GET /api/search/web/tool-schema
Preismodell	Abo + Credits	Abo + Credits	Pro Query	Pay-as-you-go, $5 / 5.000
Bei Fehlern abgerechnet?	Plan-abhängig	Plan-abhängig	Ja	Nein — nur HTTP 200
Bestes Einsatzfeld	Hosted RAG / Chat-Assistent	Semantische Entdeckung	Eigene SERP-Pipeline	AI-Agenten-Tool-Calling, RAG

Output-Form: das Wichtigste

Die Kategorie existiert, weil LLMs schlecht über SERP-HTML reasoning machen. Sie brauchen kurzen, beschrifteten, geordneten Text. Damit ist 'wie sauber ist das Snippet' der einzige stärkste Indikator dafür, ob eine Such-API als Agentenwerkzeug taugt.

Tavily und API Pick reinigen Snippets aktiv. Exa liefert Highlights oder Contents je nach Flag — gut, aber du entscheidest die Menge. Serper gibt die rohe SERP und unterstellt einen nachgelagerten Extractor. Wenn du eh einen betreibst, ok, sonst sind das versteckte Kosten.

Eine typische API-Pick-Antwort:

{
  "results": [
    {
      "title": "Retrieval-augmented generation - Wikipedia",
      "url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
      "snippet": "Retrieval-augmented generation (RAG) is a technique that combines\nsearch with text generation, often using vector search to ground LLM\nanswers in retrieved documents."
    }
    /* …more */
  ],
  "result_count": 5,
  "credits_used": 15,
  "remaining_credits": 985
}

Diese Form passt direkt als Tool-Result in einen Function-Calling-Loop, ohne weiteres Parsing.

Filter: Land und Aktualität

Produktive Agenten brauchen zwei Filterachsen:

Land / Region: Ein UK-Finanzagent darf nicht standardmäßig nur US-Quellen liefern.
Datumsbereich: 'Was ist diese Woche passiert?' muss ältere Inhalte ausschließen können.

Alle vier unterstützen das, mit unterschiedlicher Ausdrucksstärke. API Pick nutzt ISO-Daten (start_date="2026-04-01"), eindeutiger als Googles qdr-Buckets (letzte Stunde / Tag / Woche / Monat).

Preismodell: Abo vs. Pay-as-you-go

Abo-APIs (Tavily, Exa) passen bei stetiger Last. Sie werden unbequem in drei häufigen Mustern:

Prototyping, ohne sich monatlich binden zu wollen.
Burstiger Traffic (z. B. Recherche-Agenten in Batches).
Agenten, die bei Teilfehlern aggressiv erneut versuchen.

API Pick nutzt ein Credit-Modell — $5 für 5.000 Credits, Web Search 15 Credits pro Aufruf, Credits verfallen nie, nur HTTP 200 wird abgerechnet. Wichtiger als es klingt: Eine Schleife, die bei einem 502 fünfmal erneut versucht, ist gratis, nicht 5×.

Integrationsergonomie

Reibungsarmste Integration: JSON-Tool-Definition einfügen, fertig. API Pick liefert das schon:

# OpenAI-function-Tool-Definition
curl https://www.apipick.com/api/search/web/tool-schema

# Antwort enthält OpenAI-Tool + Claude-Tool-Use-Definition

OpenAI Assistants:

from openai import OpenAI
import requests

client = OpenAI()
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()

assistant = client.beta.assistants.create(
    name="Research Agent",
    model="gpt-4o",
    tools=[{"type": "function", "function": schema["openai"]}],
)

Claude tool use:

import anthropic
import requests

schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[schema["claude"]],
    messages=[{"role": "user", "content": "Was ist diese Woche neu in der RAG-Forschung?"}],
)

Was keine dieser APIs leistet

Keine Web-Search-API liefert zuverlässig 'jedes X von dieser Domain seit 2019'. Tiefe Archivabdeckung erfordert weiterhin die Kombination aus Suche und gezieltem Crawler oder einem domänenspezifischen Datensatz. Keine entfernt sehr ähnliche URLs perfekt. Und keine löst das vorgelagerte Problem veralteter oder schwacher Quellen — das ist eine Inhaltsentscheidung deines Agenten.

Schnellauswahl

Am besten für: Hosted RAG mit gebündelter Antwort

Tavily wählen. Einzelner Endpoint, Modell wählt Quellen, schnellster Weg zum funktionierenden Chat-Assistenten.

Am besten für: semantische / Ähnlichkeits-Discovery

Exa wählen. Neuronales Ranking ist die Kernthese; Embeddings schlagen Keyword-Suche bei 'finde URLs ähnlich zu dieser'.

Am besten für: eigene SERP-Pipeline

Serper wählen. Günstigste rohe Google-SERP-JSON, Aufbereitung selbst.

Am besten für: AI-Agenten-Tool-Calling, transparente Preise, kein Monatsminimum

API Pick wählen. Vorgeformte LLM-Snippets, Land-/Datumsfilter, Pay-as-you-go, nur bei Erfolg, fertig einsetzbares Tool-Schema. Jetzt testen →

Häufig gestellte Fragen

Welche API hat den günstigsten Pro-Aufruf-Preis?

Die Preismodelle unterscheiden sich. API Pick Web Search kostet 15 Credits pro Aufruf (≈ $0.015 bei $5 / 5.000 Credits) und rechnet nur HTTP 200 ab. Tavily und Exa nutzen monatliche Abos plus Überzahlung; Serper rechnet pro Query. Bei wechselnder Last oder Agenten, die bei Fehlern erneut versuchen, gewinnt 'nur bei Erfolg' meist auf der echten Rechnung.

Funktionieren alle mit OpenAI function calling und Claude tool use?

Ja. Alle sind JSON in / JSON out und lassen sich als Tool-Funktion einbinden. API Pick stellt zusätzlich einen Tool-Schema-Endpoint (GET /api/search/web/tool-schema) bereit, sodass du die OpenAI-/Claude-Tool-Definition direkt einfügen kannst.

Ist API Pick ein Tavily-Wrapper?

Nein. API Pick betreibt eigene Index-Aggregation, Ranking- und Snippet-Aufbereitung. Die Form ist absichtlich einfacher als bei Tavily: title + URL + LLM-freundliches snippet, optional country/date. POST /api/search/web wird direkt aufgerufen — keine gehostete RAG-Schicht dazwischen.

Wie sieht die Latenz aus?

Alle vier sind für synchrone Agentenaufrufe gebaut. P50 für kurze Queries liegt im Sub-Sekundenbereich. Den größten Unterschied macht, ob im Search-Endpoint ein nachgelagerter LLM-Call läuft — reine Such-APIs sind immer schneller als 'Search + Answer'-Endpoints.

Welche Tavily-Alternative ist die nächste?

Wenn du Tavily wegen Mindestabonnement oder intransparenter Überzahlung verlässt, ist API Pick Web Search der nächste Pay-as-you-go-Drop-in: gleiche Form (ranked JSON mit Snippets), Land-/Datumsfilter, kein Monatsminimum.

APIs in diesem Artikel

Websuche

Echtzeit-Semantik-Websuche, gebaut für LLM-Tool-Calling. Liefert geordnete Titel, URLs und saubere Snippets, vorformatiert für Agenten-Konsum. Länder- und Datumsfilter unterstützt.

Nachrichtensuche

Echtzeit-Nachrichtensuche über große Medien hinweg. Datums- und Länderfilter für zeitkritische Anfragen. Gebaut für Morgen-Briefings, Marktnachrichten-Agenten und RAG-Pipelines.

URL-Content-Extract

Extrahiert sauberen, lesbaren Content aus bis zu 25 URLs pro Aufruf. Entfernt Werbung, Navigation und Boilerplate; liefert markdown-ähnlichen Text bereit für LLM-Aufnahme. 2 Credits pro URL.

Geschrieben von

Sarah Choy

CEO, API Pick

Sarah Choy ist CEO von API Pick. Sie schreibt über produktionsreife APIs für KI-Agenten und LLM-Workflows.