Tavily vs Exa vs Serper vs API Pick : quelle API de Web Search choisir pour vos LLM ?

Tavily, Exa, Serper et API Pick promettent tous d'être la couche de recherche de votre LLM. Ils diffèrent fortement sur le format, les filtres et la facturation. Comparatif terrain.
L'essentiel
- •Endpoint RAG hébergé qui rend une réponse LLM-ready → Tavily (au prix d'un classement opaque et d'un seuil mensuel).
- •Découverte sémantique, fraîcheur secondaire → Exa (budget à surveiller à grande échelle).
- •SERP Google brutes, vous gérez le nettoyage → Serper.
- •JSON déjà mis en forme, tarif transparent par appel, filtres pays/date, facturation seulement sur HTTP 200 → API Pick Web Search.
Ce que signifie 'API de Web Search pour LLM'
Les API génériques (Google Custom Search, Bing Web Search, SerpAPI) renvoient une SERP — les liens bleus et rich snippets qu'un humain voit dans son navigateur. Pour un modèle, c'est la mauvaise forme. Un agent ne veut pas parser une SERP : il veut une petite liste classée avec titre, URL et fragments propres à insérer directement dans son contexte. Les quatre API ici visent ça mais s'y prennent différemment.
On compare sur cinq axes pratiques : forme de sortie, filtres, modèle tarifaire, ergonomie d'intégration, et ce qu'elles ne font pas.
Les concurrents en un paragraphe
Tavily
RAG hébergé. tavily.search renvoie des snippets classés ; tavily.qna empaquette recherche + réponse LLM légère. Bien adapté à 'donner au modèle un blob réponse-ready'. Abonnement + crédits.
Exa (ex-Metaphor)
Index neuronal/sémantique. Pensé autour de 'trouve-moi des URL similaires à celle-ci', classement par embeddings, options highlights ou contenus. Plus fort quand la fraîcheur compte moins que la similarité thématique. Abonnement + dépassements.
Serper
API SERP Google brute. Renvoie la JSON d'une page de résultats Google réelle (organic, knowledge graph, places, videos). Vous gérez le nettoyage et le classement. Bon marché par requête, mais la couche LLM-shaping est à votre charge.
API Pick Web Search
Recherche web sémantique pay-as-you-go, pré-formatée pour le tool calling. POST /api/search/web renvoie 5 (max 10) résultats classés : title, URL, snippet propre adapté au LLM, avec country_code et start_date/end_date en option. 15 crédits par appel (≈ $0.015), facturé uniquement en cas de succès.
Côte à côte
| Tavily | Exa | Serper | API Pick | |
|---|---|---|---|---|
| Forme de sortie | Snippets ranked + réponse LLM optionnelle | URL ranked + highlights/contenu optionnels | JSON SERP Google brut | title + URL + snippet adapté LLM |
| Filtre pays | Oui | Limité | Oui | Oui (country_code) |
| Filtre date | Oui | Oui | Oui (qdr) | Oui (start_date / end_date) |
| Endpoint tool-schema | — | — | — | Oui — GET /api/search/web/tool-schema |
| Modèle tarifaire | Abonnement + crédits | Abonnement + crédits | Par requête | Pay-as-you-go, $5 / 5 000 |
| Facturation en cas d'échec ? | Selon plan | Selon plan | Oui | Non — uniquement HTTP 200 |
| Meilleur cas d'usage | RAG hébergé / chat | Découverte sémantique | Pipeline SERP maison | Tool calling d'agents IA, RAG |
Forme de sortie : le facteur principal
Cette catégorie existe parce que les LLM ne raisonnent pas bien sur le HTML d'une SERP. Ils raisonnent sur du texte court, étiqueté et classé. 'À quel point le snippet est-il propre' est donc le meilleur prédicteur unique du fait qu'une API de recherche puisse servir d'outil d'agent.
Tavily et API Pick nettoient agressivement les snippets. Exa renvoie highlights ou contenus selon les flags — bien, mais vous décidez du volume. Serper renvoie la SERP brute en supposant qu'un extracteur suit. Si vous en exploitez déjà un, parfait ; sinon, c'est du travail caché.
Une réponse type API Pick :
{
"results": [
{
"title": "Retrieval-augmented generation - Wikipedia",
"url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"snippet": "Retrieval-augmented generation (RAG) is a technique that combines\nsearch with text generation, often using vector search to ground LLM\nanswers in retrieved documents."
}
/* …more */
],
"result_count": 5,
"credits_used": 15,
"remaining_credits": 985
}Cette forme se renvoie telle quelle comme tool result au modèle, sans parsing supplémentaire.
Filtres : pays et fraîcheur
Deux axes comptent en production :
- Pays / locale : un agent financier UK ne doit pas tomber par défaut sur des sources US-only.
- Plage de dates : 'que s'est-il passé cette semaine' doit pouvoir rejeter tout ce qui dépasse 7 jours.
Les quatre exposent les deux mais avec une expressivité variable. API Pick utilise des dates ISO (start_date="2026-04-01"), sans ambiguïté, vs les buckets qdr de Google.
Modèle tarifaire : abonnement vs pay-as-you-go
Les API par abonnement (Tavily, Exa) sont adaptées à un trafic stable. Elles deviennent gênantes dans trois cas fréquents :
- Vous prototypez et ne voulez pas vous engager mensuellement.
- Trafic en pics (agent de recherche en batchs).
- Agents qui réessayent agressivement sur échecs partiels.
API Pick fonctionne en crédits — $5 = 5 000 crédits, Web Search 15 crédits par appel, crédits sans expiration, uniquement HTTP 200 facturé. Cette dernière clause compte plus qu'il n'y paraît : une boucle qui réessaye 5 fois sur un 502 transitoire est gratuite, pas 5×.
Ergonomie d'intégration
L'intégration la moins frictionnelle : 'colle un JSON, ça marche'. API Pick fournit le schéma prêt :
# Tool schema OpenAI
curl https://www.apipick.com/api/search/web/tool-schema
# Renvoie définition OpenAI tool + Claude tool useAvec OpenAI Assistants :
from openai import OpenAI
import requests
client = OpenAI()
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
assistant = client.beta.assistants.create(
name="Research Agent",
model="gpt-4o",
tools=[{"type": "function", "function": schema["openai"]}],
)Avec Claude tool use :
import anthropic
import requests
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
tools=[schema["claude"]],
messages=[{"role": "user", "content": "Résumé des recherches RAG cette semaine."}],
)Ce qu'aucune ne fait
Aucune API de Web Search ne répond fiablement à 'tout le X de ce domaine depuis 2019'. Pour une couverture archive profonde il faut combiner recherche + crawler ciblé ou dataset spécialisé. Aucune ne déduplique parfaitement les URL très proches. Et aucune ne résout le problème amont d'une source obsolète ou peu autoritaire — c'est une décision de qualité de contenu que votre agent doit prendre.
Choix rapide
Questions fréquentes
Laquelle a le meilleur coût par appel ?
Le tarif unitaire varie selon le modèle. API Pick Web Search coûte 15 crédits par appel (≈ $0.015 à $5 / 5 000 crédits) et ne facture que les HTTP 200. Tavily et Exa fonctionnent en abonnement mensuel + dépassements ; Serper facture par requête. Si votre trafic est en pics ou si vos agents réessaient, le 'paiement uniquement en cas de succès' gagne souvent sur la facture réelle.
Toutes fonctionnent-elles avec OpenAI function calling et Claude tool use ?
Oui. Toutes sont JSON in / JSON out, donc embarcables comme tool function. API Pick publie en plus un endpoint tool-schema (GET /api/search/web/tool-schema) qui renvoie une définition OpenAI function et Claude tool use prête à coller.
API Pick est-il un wrapper de Tavily ?
Non. API Pick exécute son propre pipeline d'agrégation d'index, de classement et de mise en forme des snippets. La forme est volontairement plus simple : title + URL + snippet adapté au LLM, avec filtres optionnels country / date. POST /api/search/web directement, sans couche RAG hébergée.
Quelle est la latence ?
Les quatre sont conçus pour un appel synchrone d'agent. La P50 sur des requêtes courtes reste sous la seconde. La vraie différence : passer ou non par un LLM en aval dans l'endpoint — les API de recherche pure restent toujours plus rapides que les composites 'search + answer'.
Quelle est la meilleure alternative à Tavily ?
Si vous quittez Tavily pour le seuil mensuel ou les frais opaques, API Pick Web Search est le pay-as-you-go le plus proche : même forme (JSON ranked avec snippets), filtres pays/date, sans minimum mensuel.
APIs utilisées dans cet article
Sarah Choy est CEO d'API Pick. Elle écrit sur la création d'APIs prêtes pour la production destinées aux agents IA et aux workflows LLM.