[ search · extract ]● 2 cr/url · 30 req/min

Trích xuất Nội dung URL

Truyền một hoặc nhiều URL, nhận lại nội dung sạch, dễ đọc với điều hướng và quảng cáo đã bị loại bỏ. Thả vào pipeline RAG, luồng scrape-and-summarise của agent hay các tác vụ giám sát nội dung.

2 credits / URL30 req / minmax 25 URLs / callPOST /api/extract

Dùng thử Extract trực tiếp

Mỗi URL một dòng. Nhập API key của bạn và gửi để trích xuất nội dung.

auth · x-api-key

API Key

Chưa có API key?

Đăng nhập vào tài khoản để tạo và quản lý API key của bạn.

Đăng nhập Quản lý API Keys

[ 02 · integrate ]

Hướng dẫn tích hợp

Sao chép một đoạn mã, thay API key của bạn, chạy. Hoạt động với mọi HTTP client — các ví dụ bên dưới bằng cURL, JavaScript và Python.

spec

POST/api/extract

base

https://www.apipick.com

Extract clean readable content from one or more URLs. Removes navigation, ads, and boilerplate. Returns markdown-flavoured text ready for LLM ingestion.

tham số

urlsarray<string>bắt buộc

1–25 http(s) URLs

extract_effortstringtùy chọn

auto | low | high

response_lengthstringtùy chọn

short | medium | long

curl -X POST "https://www.apipick.com/api/extract" \
  -H "Content-Type: application/json" \
  -H "x-api-key: YOUR_API_KEY" \
  -d '{
  "urls": [
    "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
    "https://docs.anthropic.com/claude/docs/intro-to-claude"
  ],
  "extract_effort": "auto"
}'

● 200 · phản hồi

{
  "results": [
    {
      "url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
      "title": "Retrieval-augmented generation - Wikipedia",
      "content": "Retrieval-augmented generation (RAG) is a technique…",
      "status": "ok"
    }
  ],
  "result_count": 1,
  "credits_used": 2,
  "remaining_credits": 98
}

[ 03 · limits ]

Giới hạn tần suất

Giới hạn tốc độ tính theo từng API key, cửa sổ trượt 60 giây. Vượt giới hạn, bạn nhận được phản hồi 429 sạch sẽ kèm header Retry-After.

tốc độ request

30req/min

Theo từng API key, từng endpoint. Cửa sổ trượt 60 giây.

đồng thời

3concurrent

Số request đang chạy tối đa đồng thời cho mỗi API key.

header phản hồi

X-RateLimit-LimitSố request tối đa cho phép mỗi phút

X-RateLimit-RemainingSố request còn lại trong cửa sổ hiện tại

X-RateLimit-ResetSố giây cho đến khi cửa sổ hiện tại được đặt lại

Retry-AfterSố giây cần chờ trước khi thử lại (chỉ khi 429)

● 429 · quá nhiều request

HTTP/1.1 429 Too Many Requests
Retry-After: 12
X-RateLimit-Limit: 30
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 12

{
  "error": "rate_limit_exceeded",
  "message": "Rate limit exceeded: 30 requests/minute per API key. Retry after 12s.",
  "retry_after": 12
}

Câu hỏi thường gặp

Credit được tính như thế nào?

2 credit cho mỗi URL gửi đi. Một lượt gọi với 5 URL tốn 10 credit. Tối đa 25 URL mỗi lượt gọi.

Phản hồi trông như thế nào?

Một mảng các object { url, title, content, status }. content là văn bản sạch, dễ đọc (dạng markdown), đã loại bỏ mã rác. Phù hợp để LLM tiêu thụ trực tiếp.

Tôi có thể kiểm soát độ sâu trích xuất không?

Truyền extract_effort (auto, low, high). 'auto' là mặc định và hoạt động tốt cho hầu hết các trang. 'high' chậm hơn nhưng làm kỹ hơn trên các trang nặng JS hoặc kiểu có tường phí.

Điều gì xảy ra nếu một URL thất bại?

Các URL thất bại sẽ có status được đặt thành mã lỗi trong mảng kết quả, nhưng lượt gọi tổng thể vẫn thành công. Credit được tính cho tất cả URL gửi đi bất kể kết quả của từng URL.

Có tool schema không?

GET /api/extract/tool-schema trả về định nghĩa function của OpenAI và tool use của Claude.