Trích xuất Nội dung URL
Truyền một hoặc nhiều URL, nhận lại nội dung sạch, dễ đọc với điều hướng và quảng cáo đã bị loại bỏ. Thả vào pipeline RAG, luồng scrape-and-summarise của agent hay các tác vụ giám sát nội dung.
Dùng thử Extract trực tiếp
Mỗi URL một dòng. Nhập API key của bạn và gửi để trích xuất nội dung.
Chưa có API key?
Đăng nhập vào tài khoản để tạo và quản lý API key của bạn.
Hướng dẫn tích hợp
Sao chép một đoạn mã, thay API key của bạn, chạy. Hoạt động với mọi HTTP client — các ví dụ bên dưới bằng cURL, JavaScript và Python.
/api/extracthttps://www.apipick.comExtract clean readable content from one or more URLs. Removes navigation, ads, and boilerplate. Returns markdown-flavoured text ready for LLM ingestion.
urlsarray<string>bắt buộc1–25 http(s) URLs
extract_effortstringtùy chọnauto | low | high
response_lengthstringtùy chọnshort | medium | long
curl -X POST "https://www.apipick.com/api/extract" \
-H "Content-Type: application/json" \
-H "x-api-key: YOUR_API_KEY" \
-d '{
"urls": [
"https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"https://docs.anthropic.com/claude/docs/intro-to-claude"
],
"extract_effort": "auto"
}'{
"results": [
{
"url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"title": "Retrieval-augmented generation - Wikipedia",
"content": "Retrieval-augmented generation (RAG) is a technique…",
"status": "ok"
}
],
"result_count": 1,
"credits_used": 2,
"remaining_credits": 98
}Giới hạn tần suất
Giới hạn tốc độ tính theo từng API key, cửa sổ trượt 60 giây. Vượt giới hạn, bạn nhận được phản hồi 429 sạch sẽ kèm header Retry-After.
30req/min
Theo từng API key, từng endpoint. Cửa sổ trượt 60 giây.
3concurrent
Số request đang chạy tối đa đồng thời cho mỗi API key.
X-RateLimit-LimitSố request tối đa cho phép mỗi phútX-RateLimit-RemainingSố request còn lại trong cửa sổ hiện tạiX-RateLimit-ResetSố giây cho đến khi cửa sổ hiện tại được đặt lạiRetry-AfterSố giây cần chờ trước khi thử lại (chỉ khi 429)HTTP/1.1 429 Too Many Requests
Retry-After: 12
X-RateLimit-Limit: 30
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 12
{
"error": "rate_limit_exceeded",
"message": "Rate limit exceeded: 30 requests/minute per API key. Retry after 12s.",
"retry_after": 12
}Câu hỏi thường gặp
Credit được tính như thế nào?
2 credit cho mỗi URL gửi đi. Một lượt gọi với 5 URL tốn 10 credit. Tối đa 25 URL mỗi lượt gọi.
Phản hồi trông như thế nào?
Một mảng các object { url, title, content, status }. content là văn bản sạch, dễ đọc (dạng markdown), đã loại bỏ mã rác. Phù hợp để LLM tiêu thụ trực tiếp.
Tôi có thể kiểm soát độ sâu trích xuất không?
Truyền extract_effort (auto, low, high). 'auto' là mặc định và hoạt động tốt cho hầu hết các trang. 'high' chậm hơn nhưng làm kỹ hơn trên các trang nặng JS hoặc kiểu có tường phí.
Điều gì xảy ra nếu một URL thất bại?
Các URL thất bại sẽ có status được đặt thành mã lỗi trong mảng kết quả, nhưng lượt gọi tổng thể vẫn thành công. Credit được tính cho tất cả URL gửi đi bất kể kết quả của từng URL.
Có tool schema không?
GET /api/extract/tool-schema trả về định nghĩa function của OpenAI và tool use của Claude.