[ search · extract ]● 2 cr/url · 30 req/min

Extração de Conteúdo de URL

Passe uma ou mais URLs e receba de volta conteúdo limpo e legível, sem navegação nem anúncios. Encaixa em pipelines RAG, fluxos de scrape-e-resume de agentes ou tarefas de monitoramento de conteúdo.

2 credits / URL30 req / minmax 25 URLs / callPOST /api/extract

Teste a Extração ao Vivo

Uma URL por linha. Insira sua API key e envie para extrair o conteúdo.

auth · x-api-key

API Key

Não tem uma API key?

Faça login na sua conta para criar e gerenciar suas API keys.

Entrar Gerenciar API keys

[ 02 · integrate ]

Guia de integração

Copie um trecho, troque sua API key e execute. Funciona em qualquer cliente HTTP — exemplos abaixo em cURL, JavaScript e Python.

spec

POST/api/extract

base

https://www.apipick.com

Extract clean readable content from one or more URLs. Removes navigation, ads, and boilerplate. Returns markdown-flavoured text ready for LLM ingestion.

parâmetros

urlsarray<string>obrigatório

1–25 http(s) URLs

extract_effortstringopcional

auto | low | high

response_lengthstringopcional

short | medium | long

curl -X POST "https://www.apipick.com/api/extract" \
  -H "Content-Type: application/json" \
  -H "x-api-key: YOUR_API_KEY" \
  -d '{
  "urls": [
    "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
    "https://docs.anthropic.com/claude/docs/intro-to-claude"
  ],
  "extract_effort": "auto"
}'

● 200 · resposta

{
  "results": [
    {
      "url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
      "title": "Retrieval-augmented generation - Wikipedia",
      "content": "Retrieval-augmented generation (RAG) is a technique…",
      "status": "ok"
    }
  ],
  "result_count": 1,
  "credits_used": 2,
  "remaining_credits": 98
}

[ 03 · limits ]

Rate limits

O throttling é por API key, em janela deslizante de 60 segundos. Ao atingir o limite, você recebe um 429 limpo com um header Retry-After.

taxa de requisições

30req/min

Por API key, por endpoint. Janela deslizante de 60 segundos.

concorrência

3concurrent

Máximo de requisições simultâneas em andamento por API key.

headers de resposta

X-RateLimit-LimitMáximo de requisições permitidas por minuto

X-RateLimit-RemainingRequisições restantes na janela atual

X-RateLimit-ResetSegundos até a janela atual reiniciar

Retry-AfterSegundos a aguardar antes de tentar novamente (apenas em 429)

● 429 · requisições em excesso

HTTP/1.1 429 Too Many Requests
Retry-After: 12
X-RateLimit-Limit: 30
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 12

{
  "error": "rate_limit_exceeded",
  "message": "Rate limit exceeded: 30 requests/minute per API key. Retry after 12s.",
  "retry_after": 12
}

Perguntas Frequentes

Como os créditos são cobrados?

2 créditos por URL enviada. Uma única chamada com 5 URLs custa 10 créditos. Máximo de 25 URLs por chamada.

Como é a resposta?

Um array de objetos { url, title, content, status }. O content é texto legível e limpo (em estilo markdown), com boilerplate removido. Adequado para consumo direto por LLM.

Posso controlar a profundidade da extração?

Passe extract_effort (auto, low, high). 'auto' é o padrão e funciona para a maioria das páginas. 'high' é mais lento, mas faz um trabalho mais completo em páginas pesadas em JS ou com estilo de paywall.

O que acontece se uma URL falhar?

URLs que falharem retornam status com um código de erro no array de resultados, mas a chamada como um todo é bem-sucedida. Os créditos são cobrados por todas as URLs enviadas, independentemente do resultado de cada uma.

Existe um tool schema?

GET /api/extract/tool-schema retorna definições de OpenAI function e Claude tool use.