URL Content Extraction
एक या अधिक URL पास करें, नेविगेशन और विज्ञापन हटाकर साफ़ पठनीय कंटेंट पाएं। RAG pipelines, एजेंट के scrape-and-summarise फ्लो या कंटेंट मॉनिटरिंग जॉब्स में जुड़ जाता है।
Extract को लाइव आज़माएं
प्रति पंक्ति एक URL। कंटेंट निकालने के लिए अपनी API key दर्ज करें और सबमिट करें।
API key नहीं है?
अपनी API keys बनाने और मैनेज करने के लिए अपने खाते में साइन इन करें।
इंटीग्रेशन गाइड
एक snippet कॉपी करें, अपनी API key बदलें, रन करें। किसी भी HTTP क्लाइंट में काम करता है — नीचे cURL, JavaScript और Python में उदाहरण।
/api/extracthttps://www.apipick.comExtract clean readable content from one or more URLs. Removes navigation, ads, and boilerplate. Returns markdown-flavoured text ready for LLM ingestion.
urlsarray<string>आवश्यक1–25 http(s) URLs
extract_effortstringवैकल्पिकauto | low | high
response_lengthstringवैकल्पिकshort | medium | long
curl -X POST "https://www.apipick.com/api/extract" \
-H "Content-Type: application/json" \
-H "x-api-key: YOUR_API_KEY" \
-d '{
"urls": [
"https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"https://docs.anthropic.com/claude/docs/intro-to-claude"
],
"extract_effort": "auto"
}'{
"results": [
{
"url": "https://en.wikipedia.org/wiki/Retrieval-augmented_generation",
"title": "Retrieval-augmented generation - Wikipedia",
"content": "Retrieval-augmented generation (RAG) is a technique…",
"status": "ok"
}
],
"result_count": 1,
"credits_used": 2,
"remaining_credits": 98
}Rate limits
थ्रॉटलिंग प्रति API key है, 60-सेकंड की स्लाइडिंग विंडो। लिमिट पार करने पर आपको Retry-After हेडर के साथ साफ़ 429 मिलता है।
30req/min
प्रति API key, प्रति endpoint। 60-सेकंड की स्लाइडिंग विंडो।
3concurrent
प्रति API key अधिकतम एक साथ चल रहे requests।
X-RateLimit-Limitप्रति मिनट अनुमत अधिकतम requestsX-RateLimit-Remainingमौजूदा विंडो में शेष requestsX-RateLimit-Resetमौजूदा विंडो रीसेट होने में सेकंडRetry-Afterपुनः प्रयास से पहले प्रतीक्षा के सेकंड (केवल 429 पर)HTTP/1.1 429 Too Many Requests
Retry-After: 12
X-RateLimit-Limit: 30
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 12
{
"error": "rate_limit_exceeded",
"message": "Rate limit exceeded: 30 requests/minute per API key. Retry after 12s.",
"retry_after": 12
}अक्सर पूछे जाने वाले प्रश्न
credits कैसे चार्ज होते हैं?
प्रति सबमिट किए गए URL 2 credits। 5 URL वाली एक कॉल की लागत 10 credits होती है। प्रति कॉल अधिकतम 25 URL।
response कैसा दिखता है?
{ url, title, content, status } ऑब्जेक्ट्स की एक array। content साफ़ किया हुआ पठनीय टेक्स्ट (markdown-शैली) है, जिसमें से boilerplate हटा दिया गया है। सीधे LLM उपभोग के लिए उपयुक्त।
क्या मैं एक्सट्रैक्शन डेप्थ नियंत्रित कर सकता हूं?
extract_effort (auto, low, high) पास करें। 'auto' डिफ़ॉल्ट है और अधिकांश पेजों के लिए काम करता है। 'high' धीमा है लेकिन JS-भारी या paywall-शैली के पेजों पर अधिक गहन काम करता है।
अगर कोई URL विफल हो जाए तो क्या होता है?
विफल URLs परिणाम array में status को एक error कोड पर सेट करके लौटते हैं, लेकिन कॉल कुल मिलाकर सफल होती है। प्रति-URL परिणाम की परवाह किए बिना सभी सबमिट किए गए URLs के लिए credits चार्ज होते हैं।
क्या कोई tool schema है?
GET /api/extract/tool-schema OpenAI function और Claude tool use परिभाषाएं लौटाता है।