Google Patents API ख़त्म हो गई — prior-art और freedom-to-operate सर्च के लिए 6 विकल्प

Google Patents Public Datasets बिना किसी documented replacement के बंद हो गई, और USPTO ने 2026 के मध्य में PEDS को एक नए Open Data Portal में migrate कर दिया, रास्ते में pipelines तोड़ते हुए। 2026 में prior-art, FTO और IP-research workloads के लिए जो वास्तव में काम करता है, वह यहाँ है — छह विकल्प, साथ-साथ।
TL;DR
- •Google Patents Public Datasets API को deprecate कर दिया गया; programmatic patent search के लिए Google का कोई first-party replacement नहीं है।
- •USPTO ने legacy PEDS को Open Data Portal (ODP) से बदल दिया — US filings के लिए full-text और metadata, REST + JSON, मुफ़्त।
- •EPO OPS international families के लिए सबसे authoritative है, पर XML लौटाता है और rate-limited है।
- •PatentsView (USPTO-funded) metadata और disambiguation के लिए बढ़िया है, पर इसमें full-text claims नहीं हैं।
- •API Pick Patent Search एक ही POST endpoint में USPTO + EPO + WIPO + JPO + KIPO + CNIPA पर semantic retrieval को लपेटता है, JSON in / JSON out, प्रति call 80 credits।
क्या बदला और यह लेख क्यों मौजूद है
2024 और 2026 के बीच patent-search API ecosystem में दो चीज़ें टूटीं, और वे एक ही समय पर टूटीं।
पहली, Google Patents Public Datasets की keyword-search API — prior-art और competitive intel का काम करने वाले indie devs के लिए वस्तुतः default — का maintenance बंद हो गया। BigQuery का patents-public-data dataset अब भी bulk analytics के लिए वहाँ है, पर वे सरल https://patents.googleapis.com/... endpoints जो अधिकांश weekend-project patent tools को चलाते थे, ख़त्म हो गए हैं। "Google Patents API alternative 2026" खोजें और आपको सौ Stack Overflow questions मिलेंगे और शून्य answers।
दूसरी, USPTO ने 2024 के अंत में legacy Patent Examination Data System (PEDS) को सेवानिवृत्त कर दिया और बाकी bulk endpoints को 29 मई 2026 तक नए Open Data Portal (ODP) में migrate कर रहा है। जो pipelines PEDS XML responses को scrape करती थीं वे 2025 की शुरुआत में टूटने लगीं; जो teams Q1 2026 तक migrate नहीं हुईं वे अब चुपचाप टूटी हुई हैं।
दोनों घटनाएँ लगभग उसी समय हुईं जब AI-for-IP startups (Solve Intelligence, Patlytics, NLPatent, IPRally, &AI) ने भारी पैसा जुटाया — अकेले Solve Intelligence ने AI patent search और drafting के लिए $40M की Series B बंद की। माँग कभी इतनी ज़्यादा नहीं रही; supply side अभी और गड़बड़ हो गया।
यहाँ वे छह APIs हैं जो 2026 में वास्तव में काम करती हैं, हर एक किसमें अच्छी है, और हर एक कहाँ कम पड़ती है।
छह विकल्प
1. USPTO Open Data Portal (ODP)
PEDS का आधिकारिक US replacement। REST + JSON, मुफ़्त, United States Patent and Trademark Office के patent applications, granted patents और assignment data को कवर करता है। Full-text उपलब्ध। Documentation developer.uspto.gov पर।
ताक़त: authoritative, मुफ़्त, full text कवर करता है। कमज़ोरी: केवल US (international के लिए आपको अब भी EPO OPS या अन्य की ज़रूरत होगी), migration window के दौरान schema changes ने कुछ pipelines तोड़ी हैं, कोई semantic search नहीं — केवल keyword/Boolean।
2. EPO OPS (Open Patent Services)
European Patent Office की developer API। INPADOC database के ज़रिये EP, WO और कई national filings को कवर करती है। International family lookups और PCT data के लिए authoritative।
ताक़त: सबसे अच्छी international coverage, legal status और family info शामिल। कमज़ोरी: XML लौटाती है (भारी parsing), free tier 500MB/week पर सीमित, अलग fulltext endpoint, ऊँचे tiers के लिए OAuth flow। पहली बार integrate करने वालों के लिए steep learning curve।
3. PatentsView
USPTO-funded research tool। Metadata पर मज़बूत: assignee disambiguation, inventor profiles, citation networks, government-interest funding। मुफ़्त।
ताक़त: साफ़ disambiguated entities, आसान REST + JSON। कमज़ोरी: कोई full-text claims body नहीं, US-focused, real-time filings से पीछे, semantic similarity search के लिए optimized नहीं।
4. Lens.org
100+ jurisdictions से 95M+ patents के साथ-साथ scholarly works को कवर करने वाला aggregator। IP analysts और academic researchers द्वारा इस्तेमाल किया जाता है। Free academic tier; commercial tier billed।
ताक़त: सबसे व्यापक jurisdiction coverage, patents को scholarly literature से जोड़ता है, human follow-up के लिए अच्छा UI। कमज़ोरी: commercial pricing अपारदर्शी, semantic search embedding-native के बजाय keyword-augmented है।
5. PQAI (Project PQAI)
AT&T की IP team द्वारा चलाई जाने वाली open-source patent-search परियोजना। मुफ़्त, USPTO + EPO पर semantic similarity। indie / r/LocalLLaMA समुदाय में लोकप्रिय — DEV.to का "I posted my patent search AI to Reddit and got 65 upvotes" लेख देखें जिसने ecosystem के इस कोने को उभारा।
ताक़त: मुफ़्त, semantic-first, moderate volume के लिए कोई API key नहीं चाहिए। कमज़ोरी: best-effort uptime, कोई SLA नहीं, छोटी jurisdictional coverage, कोई commercial support नहीं।
6. API Pick Patent Search
एक ही REST call में USPTO + EPO + WIPO + JPO + KIPO + CNIPA पर semantic search। JSON in / JSON out, प्रति call 80 credits (~$0.08 $5 / 5,000 credits पर), only-on-success billing। हर hit के लिए title, abstract, snippet, URL, jurisdiction और assignee लौटाता है।
ताक़त: सभी प्रमुख offices को कवर करने वाला एक endpoint, LLM consumption के लिए पहले से आकार दिए गए ranked semantic results, predictable per-call pricing। कमज़ोरी: legal-status edge cases के लिए सीधे EPO OPS से कम configurable; अगर आपको bulk dataset analytics चाहिए, तो BigQuery अब भी per-call APIs से बेहतर है।
साथ-साथ
| USPTO ODP | EPO OPS | PatentsView | Lens.org | PQAI | API Pick | |
|---|---|---|---|---|---|---|
| Coverage | केवल US | EP + WO + INPADOC के ज़रिये कई national | केवल US | 100+ jurisdictions | USPTO + EPO | USPTO + EPO + WIPO + JPO + KIPO + CNIPA |
| Full-text claims | हाँ | हाँ (अलग endpoint) | नहीं (केवल metadata) | हाँ (commercial) | हाँ | हाँ (snippet) |
| Search type | Keyword/Boolean | Keyword/Boolean | Field-filtered | Keyword + faceted | Semantic | Semantic |
| Format | JSON | XML | JSON | JSON | JSON | JSON |
| Pricing | मुफ़्त | मुफ़्त 500 MB/wk + paid | मुफ़्त | Free academic + paid | मुफ़्त | $5 / 5,000 credits, 80/call |
| Best fit | US gov-grade source | International families और legal status | Assignee/inventor metadata | Aggregated multi-jurisdiction analytics | Open-source semantic exploration | Production AI agents, prior-art / FTO |
काम करने वाला कोड: वही prior-art query, छह तरीकों से
उदाहरण query: "wireless charging coil with embedded ferrite for under-display sensors." एक वास्तविक FTO-shaped प्रश्न।
USPTO ODP
import requests
# Open Data Portal — keyword/Boolean
r = requests.get(
"https://api.uspto.gov/api/v1/patent/applications/search",
params={
"query": "wireless charging coil ferrite under-display",
"fields": "applicationNumber,inventionTitle,filingDate,abstractText",
"limit": 25,
},
)
print(r.json()["results"][:3])EPO OPS
import requests
from base64 import b64encode
# OAuth: token from Consumer Key + Secret
auth = b64encode(b"YOUR_KEY:YOUR_SECRET").decode()
token = requests.post(
"https://ops.epo.org/3.2/auth/accesstoken",
headers={"Authorization": f"Basic {auth}"},
data={"grant_type": "client_credentials"},
).json()["access_token"]
# Then search
r = requests.get(
"https://ops.epo.org/3.2/rest-services/published-data/search",
params={"q": 'ti="wireless charging coil ferrite"'},
headers={"Authorization": f"Bearer {token}", "Accept": "application/xml"},
)
# Returns XML — you'll need lxml or xmltodict
print(r.text[:500])PatentsView
import requests
r = requests.post(
"https://search.patentsview.org/api/v1/patent/",
headers={"X-Api-Key": "YOUR_KEY"},
json={
"q": {"_text_phrase": {"patent_title": "wireless charging coil"}},
"f": ["patent_id", "patent_title", "patent_date", "assignees"],
"o": {"size": 25},
},
)
print(r.json()["patents"][:3])Lens.org
import requests
# Lens uses Lucene-style queries; commercial endpoints require paid token
r = requests.post(
"https://api.lens.org/patent/search",
headers={"Authorization": "Bearer YOUR_TOKEN"},
json={
"query": {
"match": {
"full_text": "wireless charging coil ferrite under-display sensor"
}
},
"size": 25,
},
)
print(r.json()["data"][:3])PQAI
import requests
r = requests.get(
"https://api.projectpq.ai/patents/",
params={
"q": "wireless charging coil with embedded ferrite for under-display sensors",
"n": 10,
},
)
print(r.json()["results"][:3])API Pick Patent Search
import requests
r = requests.post(
"https://www.apipick.com/api/search/patents",
headers={"x-api-key": "pk_yourkey"},
json={
"query": "wireless charging coil with embedded ferrite for under-display sensors",
},
)
print(r.json()["results"][:3])
# Each result: { title, abstract, snippet, url, jurisdiction, assignee }
# Ranked by semantic similarity. 80 credits, only on HTTP 200.कैसे चुनें, use case के अनुसार
यह किस ओर जा रहा है
AI-for-IP इस समय सबसे तेज़ी से बढ़ने वाली software verticals में से एक है। 18 महीनों के भीतर "patent search = UI में Boolean query डालना" वाली धारणा उतनी ही पुरानी लगेगी जितनी "code search = grep में regex डालना"। जो teams आज काम करने वाले products भेज रही हैं वे वही हैं जिन्होंने 2025 में migration tax चुकाया — resilient programmatic access स्थापित किया, semantic retrieval को layered किया, और public sources से अपरिहार्य schema churn के लिए एक cleanup pipeline बनाई।
अधिकांश production AI agents के लिए आपको एक API चुनने की ज़रूरत नहीं है — आपको predictable pricing के साथ एक समझदार default चाहिए और edge cases के लिए lower-level source पर उतरने का विकल्प। इसीलिए हमने API Pick Patent Search को प्रमुख offices पर एक ही semantic endpoint के रूप में बनाया: यह 95% agent workloads को कवर करता है और शेष 5% सीधे EPO OPS या USPTO ODP को call कर सकता है। साथी URL Extract वहीं से उठाता है जहाँ इनमें से कोई भी छोड़ता है — deep claim analysis के लिए किसी विशिष्ट filing का full text लाते हुए।
अक्सर पूछे जाने वाले प्रश्न
क्या Google Patents Public Datasets API सचमुच ख़त्म हो गई है?
BigQuery dataset अब भी bulk analytics के लिए मौजूद है, पर keyword-search API endpoint जिसे developers 2018-2022 में इस्तेमाल करते थे, अब न maintain किया जाता है न documented है। Google का कोई first-party replacement नहीं है। patents.google.com पर web search इंसानों के लिए काम करती है पर programmatic access के लिए नहीं बनी है — इसका scraping कुछ ही मिनटों में anti-bot protection को trigger कर देता है।
कौन-सा विकल्प मुझे full-text claims देता है?
USPTO Open Data Portal US filings के लिए full-text लौटाता है (10-Q जैसा विस्तार)। EPO OPS एक अलग fulltext endpoint के ज़रिये European filings के लिए full-text लौटाता है। PatentsView आपको केवल metadata देता है — कोई claims body नहीं। API Pick Patent Search सभी प्रमुख offices में title, abstract, claims और LLM consumption के लिए पहले से आकार दिया गया एक snippet लौटाता है।
programmatic तरीके से freedom-to-operate (FTO) search करने का सबसे सरल तरीका क्या है?
न्यूनतम व्यवहार्य FTO loop: (1) अपनी invention description से प्रमुख technical concepts निकालें, (2) एक multi-jurisdiction patent corpus पर semantic-search करें, (3) high similarity वाले hits के लिए full claims खींचें और एक LLM के साथ relevance check चलाएँ, (4) equivalents को dedupe करने के लिए patent family के अनुसार cluster करें। API Pick Patent Search एक ही call में USPTO + EPO + WIPO पर steps 2-3 को कवर करता है; assignee context के लिए इसे URL Extract या company-fact lookup के साथ जोड़ें।
हर विकल्प पर एक FTO search की वास्तव में लागत कितनी आती है?
USPTO ODP और PatentsView मुफ़्त हैं पर rate-limited हैं और बहुत सारे glue code की ज़रूरत होती है। EPO OPS में एक free tier (500MB/week) के साथ paid भी है; XML parsing भारी है। Lens.org में एक free academic tier और paid commercial है। PQAI academic / hobbyist research के लिए मुफ़्त है। API Pick Patent Search प्रति call 80 credits है (list price पर ~$0.08) जो सभी प्रमुख offices को एक ही request में कवर करता है — हर मामले में engineering की लागत API की लागत पर हावी रहती है।
क्या मैं legal opinions के लिए इन पर भरोसा कर सकता हूँ?
किसी भी API output को legal opinion के रूप में प्रस्तुत नहीं किया जाना चाहिए। Patent searches attorney के काम को सूचित करती हैं; उसकी जगह नहीं लेतीं। litigation-grade prior-art (जैसे PTAB invalidity) के लिए, API-driven recall को attorney-led precision review और certified search firms के साथ जोड़ें। competitive-intelligence और engineering-team workflows के लिए, programmatic search सही उपकरण है।
इस लेख में उपयोग की गई APIs
Sarah Choy, API Pick की CEO हैं। वे AI एजेंट्स और LLM वर्कफ़्लो के लिए प्रोडक्शन-रेडी APIs बनाने के बारे में लिखती हैं।