Tavily vs Exa vs Serper vs API Pick: welke Web Search API voor LLM's?

Tavily, Exa, Serper en API Pick beloven allemaal de zoeklaag voor je LLM te zijn. Ze verschillen sterk in uitvoervorm, filters en hoe ze factureren. Hier een vergelijking van iemand die agents naar productie brengt.
TL;DR
- •Kies Tavily als je één gehoste RAG-endpoint wilt dat LLM-klare antwoorden teruggeeft — ten koste van ondoorzichtige ranking en een abonnementsbodem.
- •Kies Exa voor semantic-first ontdekking waar neurale ranking meer telt dan versheid; begroot dienovereenkomstig op schaal.
- •Kies Serper als je ruwe Google-SERP's nodig hebt en zelf het opschonen, ranken en vormgeven van snippets doet.
- •Kies API Pick Web Search als je vooraf gevormde JSON-snippets wilt, transparante prijzen per call in credits, land- & datumfilters, en alleen betaalt voor HTTP 200-responses.
Wat een 'web search API voor LLM's' eigenlijk betekent
Algemene zoek-API's zoals Google Custom Search, Bing Web Search en SerpAPI geven zoekmachine-resultatenpagina's terug — dezelfde blauwe links en rich snippets die een mens zou zien. Dat formaat is verkeerd voor een taalmodel. Een agent wil geen SERP parsen. Hij wil een kleine, gerankte lijst van titels, URL's en schone tekstsnippets die hij rechtstreeks in een context-venster kan citeren. De vier API's hier beloven dat allemaal, maar ze maken verschillende afwegingen in hoe ze het doen.
We vergelijken op vijf praktische assen: uitvoervorm, filteren, prijsmodel, integratie-ergonomie en wat ze niet doen.
De kandidaten, elk in één alinea
Tavily
Gehoste RAG-as-a-service. tavily.search geeft gerankte snippets terug; tavily.qna bundelt zoeken met een snel LLM-antwoord. Past sterk bij chat-assistenten waar je 'geef het model een antwoordklare blob' wilt. Abonnementsgebaseerd met gebruikscredits.
Exa (voorheen Metaphor)
Neurale / semantic-first index. Ontworpen rond 'vind me URL's die op deze URL lijken' en embedding-gebaseerde ranking, met opties om highlights of volledige content op te halen. Het sterkst wanneer versheid minder telt dan thematische gelijkenis. Abonnement met credit-overschrijdingen.
Serper
Ruwe Google-SERP-API. Geeft de JSON-vorm van een echte Google-zoekresultatenpagina terug — organic, knowledge graph, places, videos. Het opschonen van snippets en de ranking doe je zelf. Goedkoop per query, maar de LLM-vormgevingslaag bouw jij.
API Pick Web Search
Pay-as-you-go semantische webzoekopdracht, gevormd voor LLM tool calling. POST /api/search/web geeft 5 (max 10) gerankte resultaten terug met titels, URL's en vooraf opgeschoonde snippets, plus optionele country_code- en start_date/end_date-filters. 15 credits per call (~$0,015), alleen afgetrokken bij succes.
Naast elkaar
| Tavily | Exa | Serper | API Pick | |
|---|---|---|---|---|
| Uitvoervorm | Gerankte snippets + optioneel gebundeld LLM-antwoord | Gerankte URL's + optionele highlights/content | Ruwe Google-SERP-JSON | Geranked title + URL + LLM-vriendelijke snippet |
| Landfilter | Ja | Beperkt | Ja | Ja (country_code) |
| Datumbereikfilter | Ja | Ja | Ja (qdr) | Ja (start_date / end_date) |
| Tool-schema-endpoint | — | — | — | Ja — GET /api/search/web/tool-schema |
| Prijsmodel | Abonnement + credits | Abonnement + credits | Per query | Pay-as-you-go credits, $5 / 5k |
| Kosten bij mislukking? | Wisselt | Wisselt | Ja | Nee — alleen bij HTTP 200 |
| Beste toepassing | Gehoste RAG / chat-assistenten | Semantische ontdekking / gelijkenis | Eigen SERP-pipelines | Tool calling voor AI-agents, RAG-pipelines |
Uitvoervorm: het onderdeel dat het meest telt
De reden dat deze categorie überhaupt bestaat, is dat LLM's niet effectief kunnen redeneren over een SERP-HTML-blob. Ze redeneren over korte, benoemde, gerankte tekst. De grootste enkele voorspeller van of een zoek-API goed werkt als agent-tool is daarom: hoe schoon is de snippet?
Tavily en API Pick schonen snippets agressief op. Exa geeft afhankelijk van flags ofwel highlights ofwel content terug — prima, maar jij bepaalt hoeveel je vraagt. Serper overhandigt je de ruwe SERP en gaat ervan uit dat je daarna een extractor draait. Dat is een redelijke keuze als je al een content-extractor beheert; anders is het verborgen werk.
Bij API Pick ziet een typische response er zo uit:
{
"results": [
{
"title": "Retrieval-augmented generation - Wikipedia",
"url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"snippet": "Retrieval-augmented generation (RAG) is a technique that combines\nsearch with text generation, often using vector search to ground LLM\nanswers in retrieved documents."
}
/* …more */
],
"result_count": 5,
"credits_used": 15,
"remaining_credits": 985
}Die vorm valt zonder verder parsen rechtstreeks in een function-calling-response.
Filteren: land en recentheid
Twee filterdimensies tellen voor productie-agents:
- Land / locale: een financiële agent in het VK zou standaard niet alleen Amerikaanse bronnen moeten krijgen.
- Datumbereik: een marktonderzoeksagent die vraagt 'wat is er deze week gebeurd' moet alles ouder dan 7 dagen afwijzen.
Alle vier API's bieden een of andere vorm van beide, maar de expressiviteit verschilt. API Pick gebruikt ISO-datumstrings (start_date="2026-04-01"), wat ondubbelzinnig is, tegenover Google's grovere qdr-buckets (afgelopen uur / dag / week / maand).
Prijsmodel: abonnement vs pay-as-you-go
Abonnementsgebaseerde API's (Tavily, Exa) werken goed wanneer je voorspelbaar, gelijkmatig verkeer hebt. Ze worden onhandig in drie veelvoorkomende patronen:
- Je bent aan het prototypen en wilt geen maandelijkse verplichting.
- Je verkeer is pieksgewijs (bijv. een onderzoeksagent die in batches draait).
- Je bouwt agents die agressief retryen bij gedeeltelijke mislukkingen.
API Pick gebruikt een credit-model — $5 koopt 5.000 credits; Web Search kost 15 credits per call; credits verlopen nooit en worden alleen afgetrokken bij HTTP 200-responses. Die laatste clausule telt zwaarder dan het klinkt: een agent-loop die vijf keer retryt op een tijdelijke 502 is gratis, niet 5×.
Integratie-ergonomie
De integratie met de minste wrijving is er een waarbij je een JSON-tool-schema in je agent-code kunt plakken zonder een wrapper te schrijven. API Pick publiceert kant-en-klare schema's:
# OpenAI function tool schema
curl https://www.apipick.com/api/search/web/tool-schema
# Returns OpenAI tool definition + Claude tool use definitionMet OpenAI Assistants:
from openai import OpenAI
import requests
client = OpenAI()
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
assistant = client.beta.assistants.create(
name="Research Agent",
model="gpt-4o",
tools=[{"type": "function", "function": schema["openai"]}],
)Met Claude tool use:
import anthropic
import requests
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
tools=[schema["claude"]],
messages=[{"role": "user", "content": "What's new in RAG research this week?"}],
)Wat geen van deze API's doet
Geen enkele web search API beantwoordt betrouwbaar 'elke X van dit domein sinds 2019'. Voor diepe archiefdekking wil je zoeken nog steeds combineren met een gerichte crawler of een domeinspecifieke dataset. Geen ervan dedupliceert sterk gelijkende URL's perfect. En geen ervan lost het upstream-probleem van een verouderde of laag-gezaghebbende bron op — dat is een contentkwaliteitsbeslissing die je agent moet nemen.
Snel kiezen
Veelgestelde vragen
Welke API heeft de beste prijs per call?
De prijs per call verschilt. API Pick Web Search kost 15 credits per call (≈ $0,015 bij het tarief van $5 / 5.000 credits) en trekt alleen credits af bij HTTP 200-responses. Tavily en Exa gebruiken maandabonnementen plus credit-overschrijdingen; Serper factureert per query. Als je verkeer pieksgewijs is of je mislukte calls opnieuw uitvoert tijdens agent-retries, wint het only-on-success-model meestal op werkelijke uitgaven.
Werken ze allemaal met OpenAI function calling en Claude tool use?
Ja. Ze bieden allemaal een JSON-in / JSON-out interface, dus je kunt elk ervan als toolfunctie verpakken. API Pick publiceert daarnaast een OpenAI/Claude tool-schema-endpoint (GET /api/search/web/tool-schema), zodat je de exacte JSON-definitie in je agent-loop kunt plakken.
Is API Pick een Tavily-wrapper?
Nee. API Pick draait zijn eigen pipeline voor zoekindex-aggregatie, ranking en snippet-vormgeving. De uitvoer is bewust eenvoudiger dan die van Tavily: geranked title + URL + LLM-vriendelijke snippet, met optionele land- en datumbereikfilters. Je kunt POST /api/search/web rechtstreeks aanroepen zonder gehoste RAG-laag.
En de latentie?
Alle vier zijn ontworpen voor synchrone agent-calls. De P50-latenties zijn grofweg vergelijkbaar (sub-seconde voor korte queries). De echte latentiekloof ontstaat wanneer een API ook een downstream LLM-call binnen het zoekendpoint uitvoert — pure zoek-API's keren sneller terug dan samengestelde 'search + answer'-endpoints.
Wat is het beste Tavily-alternatief?
Verlaat je Tavily vanwege de abonnementsbodem of ondoorzichtige prijzen bij overschrijdingen, dan is API Pick Web Search de dichtstbijzijnde pay-as-you-go vervanger: dezelfde vorm (geranked, snippet-gevormde JSON), land/datumfilters, geen maandelijks minimum.
API's gebruikt in dit artikel
Sarah Choy is de CEO van API Pick. Ze schrijft over het bouwen van productieklare API's voor AI-agents en LLM-workflows.