Estrazione di contenuti URL
Passa uno o più URL e ottieni contenuti puliti e leggibili, con navigazione e pubblicità rimosse. Si inserisce in pipeline RAG, flussi di scrape-and-summarise degli agenti o job di monitoraggio dei contenuti.
Prova l'estrazione dal vivo
Un URL per riga. Inserisci la tua API key e invia per estrarre i contenuti.
Non hai una API key?
Accedi al tuo account per creare e gestire le tue API key.
Guida all'integrazione
Copia uno snippet, sostituisci la tua API key, esegui. Funziona con qualsiasi client HTTP — esempi qui sotto in cURL, JavaScript e Python.
/api/extracthttps://www.apipick.comExtract clean readable content from one or more URLs. Removes navigation, ads, and boilerplate. Returns markdown-flavoured text ready for LLM ingestion.
urlsarray<string>obbligatorio1–25 http(s) URLs
extract_effortstringfacoltativoauto | low | high
response_lengthstringfacoltativoshort | medium | long
curl -X POST "https://www.apipick.com/api/extract" \
-H "Content-Type: application/json" \
-H "x-api-key: YOUR_API_KEY" \
-d '{
"urls": [
"https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"https://docs.anthropic.com/claude/docs/intro-to-claude"
],
"extract_effort": "auto"
}'{
"results": [
{
"url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"title": "Retrieval-augmented generation - Wikipedia",
"content": "Retrieval-augmented generation (RAG) is a technique…",
"status": "ok"
}
],
"result_count": 1,
"credits_used": 2,
"remaining_credits": 98
}Limiti di frequenza
Il throttling è per API key, con finestra mobile di 60 secondi. Al raggiungimento del limite ricevi un 429 pulito con header Retry-After.
30req/min
Per API key e per endpoint. Finestra mobile di 60 secondi.
3concurrent
Numero massimo di richieste simultanee in corso per API key.
X-RateLimit-LimitNumero massimo di richieste consentite al minutoX-RateLimit-RemainingRichieste rimanenti nella finestra correnteX-RateLimit-ResetSecondi al reset della finestra correnteRetry-AfterSecondi da attendere prima di riprovare (solo in caso di 429)HTTP/1.1 429 Too Many Requests
Retry-After: 12
X-RateLimit-Limit: 30
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 12
{
"error": "rate_limit_exceeded",
"message": "Rate limit exceeded: 30 requests/minute per API key. Retry after 12s.",
"retry_after": 12
}Domande frequenti
Come vengono addebitati i crediti?
2 crediti per ogni URL inviato. Una singola chiamata con 5 URL costa 10 crediti. Massimo 25 URL per chiamata.
Che aspetto ha la risposta?
Un array di oggetti { url, title, content, status }. content è testo leggibile e pulito (in stile markdown), con il testo accessorio rimosso. Adatto al consumo diretto da parte degli LLM.
Posso controllare la profondità di estrazione?
Passa extract_effort (auto, low, high). 'auto' è il valore predefinito e funziona per la maggior parte delle pagine. 'high' è più lento ma fa un lavoro più approfondito su pagine ricche di JS o in stile paywall.
Cosa succede se un URL fallisce?
Gli URL falliti restituiscono uno status impostato su un codice di errore nell'array dei risultati, ma la chiamata nel complesso ha successo. I crediti vengono addebitati per tutti gli URL inviati indipendentemente dall'esito di ciascun URL.
Esiste uno schema tool?
GET /api/extract/tool-schema restituisce definizioni per il function calling di OpenAI e il tool use di Claude.