[ blog · comparison ]9 min read

Tavily vs Exa vs Serper vs API Pick: welke Web Search API voor LLM's?

Sarah ChoyGepubliceerd op 2 mei 20269 min leestijd

Tavily, Exa, Serper en API Pick beloven allemaal de zoeklaag voor je LLM te zijn. Ze verschillen sterk in uitvoervorm, filters en hoe ze factureren. Hier een vergelijking van iemand die agents naar productie brengt.

TL;DR

•Kies Tavily als je één gehoste RAG-endpoint wilt dat LLM-klare antwoorden teruggeeft — ten koste van ondoorzichtige ranking en een abonnementsbodem.
•Kies Exa voor semantic-first ontdekking waar neurale ranking meer telt dan versheid; begroot dienovereenkomstig op schaal.
•Kies Serper als je ruwe Google-SERP's nodig hebt en zelf het opschonen, ranken en vormgeven van snippets doet.
•Kies API Pick Web Search als je vooraf gevormde JSON-snippets wilt, transparante prijzen per call in credits, land- & datumfilters, en alleen betaalt voor HTTP 200-responses.

Wat een 'web search API voor LLM's' eigenlijk betekent

Algemene zoek-API's zoals Google Custom Search, Bing Web Search en SerpAPI geven zoekmachine-resultatenpagina's terug — dezelfde blauwe links en rich snippets die een mens zou zien. Dat formaat is verkeerd voor een taalmodel. Een agent wil geen SERP parsen. Hij wil een kleine, gerankte lijst van titels, URL's en schone tekstsnippets die hij rechtstreeks in een context-venster kan citeren. De vier API's hier beloven dat allemaal, maar ze maken verschillende afwegingen in hoe ze het doen.

We vergelijken op vijf praktische assen: uitvoervorm, filteren, prijsmodel, integratie-ergonomie en wat ze niet doen.

De kandidaten, elk in één alinea

Tavily

Gehoste RAG-as-a-service. tavily.search geeft gerankte snippets terug; tavily.qna bundelt zoeken met een snel LLM-antwoord. Past sterk bij chat-assistenten waar je 'geef het model een antwoordklare blob' wilt. Abonnementsgebaseerd met gebruikscredits.

Exa (voorheen Metaphor)

Neurale / semantic-first index. Ontworpen rond 'vind me URL's die op deze URL lijken' en embedding-gebaseerde ranking, met opties om highlights of volledige content op te halen. Het sterkst wanneer versheid minder telt dan thematische gelijkenis. Abonnement met credit-overschrijdingen.

Serper

Ruwe Google-SERP-API. Geeft de JSON-vorm van een echte Google-zoekresultatenpagina terug — organic, knowledge graph, places, videos. Het opschonen van snippets en de ranking doe je zelf. Goedkoop per query, maar de LLM-vormgevingslaag bouw jij.

API Pick Web Search

Pay-as-you-go semantische webzoekopdracht, gevormd voor LLM tool calling. POST /api/search/web geeft 5 (max 10) gerankte resultaten terug met titels, URL's en vooraf opgeschoonde snippets, plus optionele country_code- en start_date/end_date-filters. 15 credits per call (~$0,015), alleen afgetrokken bij succes.

Naast elkaar

De vergelijking weerspiegelt de algemene positionering van elke aanbieder op het moment van schrijven. Bevestig prijzen en quota altijd op de prijspagina van elke aanbieder voordat je integreert.

	Tavily	Exa	Serper	API Pick
Uitvoervorm	Gerankte snippets + optioneel gebundeld LLM-antwoord	Gerankte URL's + optionele highlights/content	Ruwe Google-SERP-JSON	Geranked title + URL + LLM-vriendelijke snippet
Landfilter	Ja	Beperkt	Ja	Ja (country_code)
Datumbereikfilter	Ja	Ja	Ja (qdr)	Ja (start_date / end_date)
Tool-schema-endpoint	—	—	—	Ja — GET /api/search/web/tool-schema
Prijsmodel	Abonnement + credits	Abonnement + credits	Per query	Pay-as-you-go credits, $5 / 5k
Kosten bij mislukking?	Wisselt	Wisselt	Ja	Nee — alleen bij HTTP 200
Beste toepassing	Gehoste RAG / chat-assistenten	Semantische ontdekking / gelijkenis	Eigen SERP-pipelines	Tool calling voor AI-agents, RAG-pipelines

Uitvoervorm: het onderdeel dat het meest telt

De reden dat deze categorie überhaupt bestaat, is dat LLM's niet effectief kunnen redeneren over een SERP-HTML-blob. Ze redeneren over korte, benoemde, gerankte tekst. De grootste enkele voorspeller van of een zoek-API goed werkt als agent-tool is daarom: hoe schoon is de snippet?

Tavily en API Pick schonen snippets agressief op. Exa geeft afhankelijk van flags ofwel highlights ofwel content terug — prima, maar jij bepaalt hoeveel je vraagt. Serper overhandigt je de ruwe SERP en gaat ervan uit dat je daarna een extractor draait. Dat is een redelijke keuze als je al een content-extractor beheert; anders is het verborgen werk.

Bij API Pick ziet een typische response er zo uit:

{
  "results": [
    {
      "title": "Retrieval-augmented generation - Wikipedia",
      "url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
      "snippet": "Retrieval-augmented generation (RAG) is a technique that combines\nsearch with text generation, often using vector search to ground LLM\nanswers in retrieved documents."
    }
    /* …more */
  ],
  "result_count": 5,
  "credits_used": 15,
  "remaining_credits": 985
}

Die vorm valt zonder verder parsen rechtstreeks in een function-calling-response.

Filteren: land en recentheid

Twee filterdimensies tellen voor productie-agents:

Land / locale: een financiële agent in het VK zou standaard niet alleen Amerikaanse bronnen moeten krijgen.
Datumbereik: een marktonderzoeksagent die vraagt 'wat is er deze week gebeurd' moet alles ouder dan 7 dagen afwijzen.

Alle vier API's bieden een of andere vorm van beide, maar de expressiviteit verschilt. API Pick gebruikt ISO-datumstrings (start_date="2026-04-01"), wat ondubbelzinnig is, tegenover Google's grovere qdr-buckets (afgelopen uur / dag / week / maand).

Prijsmodel: abonnement vs pay-as-you-go

Abonnementsgebaseerde API's (Tavily, Exa) werken goed wanneer je voorspelbaar, gelijkmatig verkeer hebt. Ze worden onhandig in drie veelvoorkomende patronen:

Je bent aan het prototypen en wilt geen maandelijkse verplichting.
Je verkeer is pieksgewijs (bijv. een onderzoeksagent die in batches draait).
Je bouwt agents die agressief retryen bij gedeeltelijke mislukkingen.

API Pick gebruikt een credit-model — $5 koopt 5.000 credits; Web Search kost 15 credits per call; credits verlopen nooit en worden alleen afgetrokken bij HTTP 200-responses. Die laatste clausule telt zwaarder dan het klinkt: een agent-loop die vijf keer retryt op een tijdelijke 502 is gratis, niet 5×.

Integratie-ergonomie

De integratie met de minste wrijving is er een waarbij je een JSON-tool-schema in je agent-code kunt plakken zonder een wrapper te schrijven. API Pick publiceert kant-en-klare schema's:

# OpenAI function tool schema
curl https://www.apipick.com/api/search/web/tool-schema

# Returns OpenAI tool definition + Claude tool use definition

Met OpenAI Assistants:

from openai import OpenAI
import requests

client = OpenAI()
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()

assistant = client.beta.assistants.create(
    name="Research Agent",
    model="gpt-4o",
    tools=[{"type": "function", "function": schema["openai"]}],
)

Met Claude tool use:

import anthropic
import requests

schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[schema["claude"]],
    messages=[{"role": "user", "content": "What's new in RAG research this week?"}],
)

Wat geen van deze API's doet

Geen enkele web search API beantwoordt betrouwbaar 'elke X van dit domein sinds 2019'. Voor diepe archiefdekking wil je zoeken nog steeds combineren met een gerichte crawler of een domeinspecifieke dataset. Geen ervan dedupliceert sterk gelijkende URL's perfect. En geen ervan lost het upstream-probleem van een verouderde of laag-gezaghebbende bron op — dat is een contentkwaliteitsbeslissing die je agent moet nemen.

Snel kiezen

Het beste voor: gehoste RAG met gebundeld antwoord

Kies Tavily. Eén endpoint, het model kiest al de bronnen, het snelst naar een werkende chat-assistent.

Het beste voor: semantische / gelijkenis-ontdekking

Kies Exa. Neurale ranking is zijn kernstelling; embeddings werken beter dan zoeken op trefwoorden voor 'vind me meer zoals deze URL'.

Het beste voor: je eigen SERP-pipeline bouwen

Kies Serper. De goedkoopste ruwe Google-SERP-JSON. Het opschonen doe jij.

Het beste voor: tool calling voor AI-agents, transparante prijzen, geen maandelijkse bodem

Kies API Pick. Vooraf gevormde LLM-klare snippets, land- en datumfilters, pay-as-you-go, alleen kosten bij succes, kant-en-klare tool-schema's. Probeer het →

Veelgestelde vragen

Welke API heeft de beste prijs per call?

De prijs per call verschilt. API Pick Web Search kost 15 credits per call (≈ $0,015 bij het tarief van $5 / 5.000 credits) en trekt alleen credits af bij HTTP 200-responses. Tavily en Exa gebruiken maandabonnementen plus credit-overschrijdingen; Serper factureert per query. Als je verkeer pieksgewijs is of je mislukte calls opnieuw uitvoert tijdens agent-retries, wint het only-on-success-model meestal op werkelijke uitgaven.

Werken ze allemaal met OpenAI function calling en Claude tool use?

Ja. Ze bieden allemaal een JSON-in / JSON-out interface, dus je kunt elk ervan als toolfunctie verpakken. API Pick publiceert daarnaast een OpenAI/Claude tool-schema-endpoint (GET /api/search/web/tool-schema), zodat je de exacte JSON-definitie in je agent-loop kunt plakken.

Is API Pick een Tavily-wrapper?

Nee. API Pick draait zijn eigen pipeline voor zoekindex-aggregatie, ranking en snippet-vormgeving. De uitvoer is bewust eenvoudiger dan die van Tavily: geranked title + URL + LLM-vriendelijke snippet, met optionele land- en datumbereikfilters. Je kunt POST /api/search/web rechtstreeks aanroepen zonder gehoste RAG-laag.

En de latentie?

Alle vier zijn ontworpen voor synchrone agent-calls. De P50-latenties zijn grofweg vergelijkbaar (sub-seconde voor korte queries). De echte latentiekloof ontstaat wanneer een API ook een downstream LLM-call binnen het zoekendpoint uitvoert — pure zoek-API's keren sneller terug dan samengestelde 'search + answer'-endpoints.

Wat is het beste Tavily-alternatief?

Verlaat je Tavily vanwege de abonnementsbodem of ondoorzichtige prijzen bij overschrijdingen, dan is API Pick Web Search de dichtstbijzijnde pay-as-you-go vervanger: dezelfde vorm (geranked, snippet-gevormde JSON), land/datumfilters, geen maandelijks minimum.

API's gebruikt in dit artikel

Webzoeken

Realtime semantisch webzoeken gebouwd voor LLM tool calling. Geeft gerangschikte titels, URL's en schone snippets terug, al voorbereid voor verbruik door agents. Filters op land en datum ondersteund.

Nieuws zoeken

Realtime nieuws zoeken bij grote media. Filtering op datumbereik en land voor tijdgevoelige query's. Gebouwd voor ochtendbriefings, marktnieuws-agents en RAG-pipelines.

URL-content-extractie

Haal schone, leesbare content uit maximaal 25 URL's per aanroep. Verwijdert advertenties, navigatie en boilerplate; geeft markdown-achtige tekst terug, klaar voor LLM-invoer. 2 credits per URL.

Geschreven door

Sarah Choy

CEO, API Pick

Sarah Choy is de CEO van API Pick. Ze schrijft over het bouwen van productieklare API's voor AI-agents en LLM-workflows.