URL Content Extraction
ส่ง URL หนึ่งรายการหรือมากกว่า แล้วรับเนื้อหาที่สะอาดและอ่านง่ายกลับมา โดยตัดเมนูนำทางและโฆษณาออก นำไปใช้กับ RAG pipeline, กระบวนการ scrape-and-summarise ของ agent หรืองานเฝ้าติดตามเนื้อหาได้เลย
ลองใช้ Extract แบบสด
หนึ่ง URL ต่อบรรทัด กรอก API key ของคุณแล้วกดส่งเพื่อดึงเนื้อหา
ยังไม่มี API Key?
เข้าสู่ระบบบัญชีของคุณเพื่อสร้างและจัดการ API Key
คู่มือการผสานรวม
คัดลอกสนิปเพ็ต แทนที่ API key ของคุณ แล้วรัน ใช้ได้กับ HTTP client ทุกตัว — ตัวอย่างด้านล่างเป็น cURL, JavaScript และ Python
/api/extracthttps://www.apipick.comExtract clean readable content from one or more URLs. Removes navigation, ads, and boilerplate. Returns markdown-flavoured text ready for LLM ingestion.
urlsarray<string>จำเป็น1–25 http(s) URLs
extract_effortstringไม่บังคับauto | low | high
response_lengthstringไม่บังคับshort | medium | long
curl -X POST "https://www.apipick.com/api/extract" \
-H "Content-Type: application/json" \
-H "x-api-key: YOUR_API_KEY" \
-d '{
"urls": [
"https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"https://docs.anthropic.com/claude/docs/intro-to-claude"
],
"extract_effort": "auto"
}'{
"results": [
{
"url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"title": "Retrieval-augmented generation - Wikipedia",
"content": "Retrieval-augmented generation (RAG) is a technique…",
"status": "ok"
}
],
"result_count": 1,
"credits_used": 2,
"remaining_credits": 98
}Rate limit
การจำกัดอัตราเป็นแบบต่อ API key ในหน้าต่างเลื่อน 60 วินาที เมื่อถึงขีดจำกัดคุณจะได้ 429 ที่สะอาดพร้อม header Retry-After
30req/min
ต่อ API key ต่อ endpoint หน้าต่างเลื่อน 60 วินาที
3concurrent
จำนวนคำขอที่กำลังดำเนินการพร้อมกันได้สูงสุดต่อ API key
X-RateLimit-Limitจำนวนคำขอสูงสุดที่อนุญาตต่อนาทีX-RateLimit-Remainingจำนวนคำขอที่เหลือในหน้าต่างปัจจุบันX-RateLimit-Resetจำนวนวินาทีจนกว่าหน้าต่างปัจจุบันจะรีเซ็ตRetry-Afterจำนวนวินาทีที่ต้องรอก่อนลองใหม่ (เฉพาะเมื่อได้ 429)HTTP/1.1 429 Too Many Requests
Retry-After: 12
X-RateLimit-Limit: 30
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 12
{
"error": "rate_limit_exceeded",
"message": "Rate limit exceeded: 30 requests/minute per API key. Retry after 12s.",
"retry_after": 12
}คำถามที่พบบ่อย
คิดค่าเครดิตอย่างไร?
2 เครดิตต่อ URL ที่ส่ง การเรียกครั้งเดียวที่มี 5 URL มีค่าใช้จ่าย 10 เครดิต สูงสุด 25 URL ต่อการเรียก
response หน้าตาเป็นอย่างไร?
เป็น array ของอ็อบเจกต์ { url, title, content, status } โดย content คือข้อความที่สะอาดอ่านง่าย (แบบ markdown) ที่ตัด boilerplate ออกแล้ว เหมาะสำหรับป้อนเข้า LLM โดยตรง
ควบคุมความลึกของการดึงได้ไหม?
ส่งค่า extract_effort (auto, low, high) โดย 'auto' เป็นค่าเริ่มต้นและใช้ได้กับหน้าเว็บส่วนใหญ่ ส่วน 'high' จะช้ากว่าแต่ทำงานละเอียดขึ้นกับหน้าที่ใช้ JS มากหรือหน้าแบบ paywall
ถ้า URL ล้มเหลวจะเกิดอะไรขึ้น?
URL ที่ล้มเหลวจะคืนค่า status เป็นรหัสข้อผิดพลาดใน array ผลลัพธ์ แต่การเรียกโดยรวมยังสำเร็จ เครดิตจะถูกคิดสำหรับทุก URL ที่ส่งโดยไม่คำนึงถึงผลลัพธ์รายตัว
มี tool schema ไหม?
GET /api/extract/tool-schema คืนคำนิยาม OpenAI function และ Claude tool use