[ blog · comparison ]9 min read

Tavily vs Exa vs Serper vs API Pick: quale API di Web Search scegliere per gli LLM?

Sarah ChoyPubblicato il 2 maggio 20269 min di lettura

Tavily, Exa, Serper e API Pick promettono di essere il layer di ricerca del tuo LLM. Differiscono molto su forma dell'output, filtri e fatturazione. Un confronto fianco a fianco di chi manda agenti in produzione.

In breve

•Vuoi un endpoint RAG ospitato che restituisce un blob pronto per l'LLM → Tavily (con il suo ranking opaco e la soglia mensile).
•Discovery semantica, freschezza meno importante → Exa (occhio al budget su larga scala).
•SERP di Google grezze, la pulizia la fai tu → Serper.
•JSON già formattato, prezzo per chiamata trasparente, filtri paese/data e paghi solo gli HTTP 200 → API Pick Web Search.

Cosa significa davvero 'API di Web Search per LLM'

Le API di ricerca generiche (Google Custom Search, Bing Web Search, SerpAPI) restituiscono una SERP — gli stessi link blu e rich snippet che vedrebbe un umano. Per un modello quel formato è sbagliato. Un agente non vuole fare il parsing di una SERP: vuole un piccolo elenco ordinato di titoli, URL e snippet di testo puliti da citare direttamente nella finestra di contesto. Le quattro API qui lo promettono tutte, ma fanno trade-off diversi su come ci arrivano.

Le confronteremo su cinque assi pratici: forma dell'output, filtri, modello di prezzo, ergonomia di integrazione e cosa non fanno.

Le contendenti, un paragrafo ciascuna

Tavily

RAG ospitato come servizio. tavily.search restituisce snippet ordinati; tavily.qna abbina la ricerca a una risposta LLM veloce. Calza bene per assistenti di chat dove vuoi 'dare al modello un blob già pronto per rispondere'. Basato su abbonamento con crediti d'uso.

Exa (ex Metaphor)

Indice neurale / semantico. Pensato per 'trovami URL simili a questa URL' e ranking basato su embedding, con opzioni per recuperare highlight o contenuto completo. Più forte quando la freschezza conta meno della similarità tematica. Abbonamento con crediti extra.

Serper

API di SERP di Google grezza. Restituisce la forma JSON di una vera pagina dei risultati (organic, knowledge graph, places, videos). La pulizia degli snippet e il ranking li fai tu. Economica per query, ma il layer di formattazione per LLM lo metti tu.

API Pick Web Search

Ricerca web semantica pay-as-you-go già formattata per il tool calling degli LLM. POST /api/search/web restituisce 5 (max 10) risultati ordinati con titoli, URL e snippet già puliti, più i filtri opzionali country_code e start_date/end_date. 15 crediti per chiamata (~$0,015), scalati solo in caso di successo.

Fianco a fianco

La tabella riflette il posizionamento generale di ciascun fornitore al momento della scrittura. Verifica sempre prezzi e quote sulla pagina prezzi di ogni fornitore prima di integrare.

	Tavily	Exa	Serper	API Pick
Forma dell'output	Snippet ordinati + risposta LLM opzionale	URL ordinati + highlight/contenuto	JSON SERP di Google	title + URL + snippet LLM-friendly
Filtro paese	Sì	Limitato	Sì	Sì (country_code)
Filtro intervallo date	Sì	Sì	Sì (qdr)	Sì (start_date / end_date)
Endpoint tool-schema	—	—	—	Sì — GET /api/search/web/tool-schema
Modello di prezzo	Abbonamento + crediti	Abbonamento + crediti	Per query	Pay-as-you-go, $5 / 5k
Addebita sui fallimenti?	Varia	Varia	Sì	No — solo su HTTP 200
Caso d'uso ideale	RAG ospitato / assistenti di chat	Discovery semantica / similarità	Pipeline SERP personalizzate	Tool calling di agenti IA, pipeline RAG

Forma dell'output: la parte che conta di più

Il motivo per cui questa categoria esiste è che gli LLM non riescono a ragionare bene su un blob HTML di SERP; ragionano su testo breve, etichettato e ordinato. Perciò il singolo miglior predittore di quanto bene un'API di ricerca funzioni come tool d'agente è: quanto è pulito lo snippet?

Tavily e API Pick puliscono gli snippet in modo aggressivo. Exa restituisce highlight o contenuto a seconda dei flag — va bene, ma decidi tu quanto chiedere. Serper ti consegna la SERP grezza e dà per scontato che subito dopo lancerai un extractor. È una scelta ragionevole se gestisci già un extractor di contenuti; altrimenti è lavoro nascosto.

Con API Pick, una risposta tipica è così:

{
  "results": [
    {
      "title": "Retrieval-augmented generation - Wikipedia",
      "url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
      "snippet": "Retrieval-augmented generation (RAG) is a technique that combines\nsearch with text generation, often using vector search to ground LLM\nanswers in retrieved documents."
    }
    /* …more */
  ],
  "result_count": 5,
  "credits_used": 15,
  "remaining_credits": 985
}

Questa forma entra direttamente in una risposta di function calling senza ulteriore parsing.

Filtri: paese e recenza

Due dimensioni di filtro contano per gli agenti in produzione:

Paese / locale: un agente finanziario nel Regno Unito non dovrebbe ricevere per default solo fonti statunitensi.
Intervallo di date: un agente di ricerche di mercato che chiede 'cosa è successo questa settimana' deve scartare tutto ciò che ha più di 7 giorni.

Tutte e quattro espongono entrambi in qualche forma, ma l'espressività varia. API Pick usa stringhe data ISO (start_date="2026-04-01"), che è inequivocabile, contro i bucket più grossolani di Google in qdr (ultima ora / giorno / settimana / mese).

Modello di prezzo: abbonamento vs pay-as-you-go

Le API ad abbonamento (Tavily, Exa) funzionano bene quando hai traffico prevedibile e costante. Diventano scomode in tre pattern comuni:

Stai prototipando e non vuoi un impegno mensile.
Il tuo traffico è a raffiche (es. un agente di ricerca che gira a lotti).
Costruisci agenti che fanno retry in modo aggressivo sui fallimenti parziali.

API Pick usa un modello a crediti — $5 comprano 5.000 crediti; la Web Search costa 15 crediti per chiamata; i crediti non scadono mai e vengono scalati solo sulle risposte HTTP 200. Quest'ultima clausola conta più di quanto sembri: un loop di agente che fa retry cinque volte su un 502 transitorio è gratis, non 5×.

Ergonomia di integrazione

L'integrazione a minore attrito è quella in cui puoi incollare un JSON di tool schema nel codice del tuo agente senza scrivere un wrapper. API Pick pubblica schema pronti all'uso:

# OpenAI function tool schema
curl https://www.apipick.com/api/search/web/tool-schema

# Returns OpenAI tool definition + Claude tool use definition

Con OpenAI Assistants:

from openai import OpenAI
import requests

client = OpenAI()
schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()

assistant = client.beta.assistants.create(
    name="Research Agent",
    model="gpt-4o",
    tools=[{"type": "function", "function": schema["openai"]}],
)

Con Claude tool use:

import anthropic
import requests

schema = requests.get("https://www.apipick.com/api/search/web/tool-schema").json()
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[schema["claude"]],
    messages=[{"role": "user", "content": "What's new in RAG research this week?"}],
)

Cosa nessuna di queste API fa

Nessuna API di web search risponderà in modo affidabile 'ogni X di questo dominio dal 2019'. Per una copertura d'archivio profonda devi comunque affiancare la ricerca a un crawler mirato o a un dataset specifico di dominio. Nessuna deduplica perfettamente gli URL molto simili. E nessuna risolve il problema a monte di una fonte obsoleta o di scarsa autorevolezza — è una decisione di qualità del contenuto che spetta al tuo agente.

Scegliere in fretta

Ideale per: RAG ospitato con risposta inclusa

Scegli Tavily. Endpoint unico, il modello sceglie già le fonti, il modo più rapido per avere un assistente di chat funzionante.

Ideale per: discovery semantica / similarità

Scegli Exa. Il ranking neurale è la sua tesi centrale; gli embedding funzionano meglio della ricerca per parole chiave per 'trovamene altri come questa URL'.

Ideale per: costruire la tua pipeline SERP

Scegli Serper. Il JSON di SERP di Google grezzo più economico. La pulizia la fai tu.

Ideale per: tool calling di agenti IA, prezzi trasparenti, nessuna soglia mensile

Scegli API Pick. Snippet pronti per LLM, filtri paese e data, pay-as-you-go, addebito solo in caso di successo, tool schema pronti da incollare. Provalo →

Domande frequenti

Quale ha il miglior prezzo per chiamata?

Dipende dal modello. API Pick Web Search costa 15 crediti per chiamata (≈ $0,015 al prezzo di $5 / 5.000 crediti) e addebita solo sugli HTTP 200. Tavily ed Exa usano abbonamenti mensili più crediti extra; Serper fattura per query. Se il tuo traffico è a raffiche o rilanci le chiamate fallite durante i retry dell'agente, il modello 'solo in caso di successo' di solito vince sulla spesa reale.

Funzionano tutte con OpenAI function calling e Claude tool use?

Sì. Sono tutte JSON in / JSON out, quindi puoi avvolgerne una qualsiasi come tool. API Pick pubblica inoltre un endpoint di tool-schema (GET /api/search/web/tool-schema) che restituisce definizioni pronte da incollare di OpenAI function e Claude tool use.

API Pick è un wrapper di Tavily?

No. API Pick esegue la propria pipeline di aggregazione dell'indice, ranking e formattazione degli snippet. La forma è volutamente più semplice di quella di Tavily: title + URL + snippet LLM-friendly, con filtri opzionali country / date. Chiami POST /api/search/web direttamente, senza un layer RAG ospitato.

E la latenza?

Tutte e quattro sono progettate per chiamate sincrone dell'agente. Le latenze P50 sono grosso modo comparabili (sotto il secondo per query brevi). Il vero scoglio di latenza è quando un'API esegue anche una chiamata LLM a valle dentro l'endpoint di ricerca — le API di ricerca pura rispondono più in fretta degli endpoint compositi 'search + answer'.

Qual è la migliore alternativa a Tavily?

Se lasci Tavily per via della soglia mensile o del costo opaco sugli sforamenti, API Pick Web Search è il sostituto pay-as-you-go più vicino: stessa forma (JSON ordinato con snippet), filtri paese/data, nessun minimo mensile.

API usate in questo articolo

Ricerca web

Ricerca web semantica in tempo reale per il tool calling degli LLM. Restituisce titoli, URL e snippet puliti e classificati, già formattati per il consumo da parte degli agenti. Supporta filtri per paese e data.

Ricerca notizie

Ricerca notizie in tempo reale tra le principali testate. Filtri per intervallo di date e paese per query urgenti. Costruita per briefing mattutini, agenti di notizie di mercato e pipeline RAG.

Estrazione di contenuti URL

Estrai contenuti puliti e leggibili da un massimo di 25 URL per chiamata. Rimuove pubblicità, navigazione e testo accessorio; restituisce testo in stile markdown pronto per l'ingestione da parte degli LLM. 2 crediti per URL.

Scritto da

Sarah Choy

CEO, API Pick

Sarah Choy è la CEO di API Pick. Scrive sulla creazione di API pronte per la produzione per agenti IA e flussi di lavoro con LLM.