API của Google Patents đã chết — 6 giải pháp thay thế cho tìm kiếm tình trạng kỹ thuật đã biết và quyền tự do khai thác

Google Patents Public Datasets bị gỡ bỏ mà không có bản thay thế được ghi tài liệu, và USPTO đã di chuyển PEDS sang một Open Data Portal mới vào giữa năm 2026, làm hỏng các pipeline trên đường đi. Đây là những gì thực sự hoạt động vào năm 2026 cho các tác vụ tình trạng kỹ thuật đã biết, FTO và nghiên cứu sở hữu trí tuệ — sáu giải pháp thay thế, đặt cạnh nhau.
Tóm tắt
- •API Google Patents Public Datasets đã bị ngừng hỗ trợ; không có bản thay thế chính thức nào từ Google cho việc tìm kiếm bằng sáng chế theo lập trình.
- •USPTO đã thay thế PEDS cũ bằng Open Data Portal (ODP) — toàn văn và siêu dữ liệu cho các hồ sơ Hoa Kỳ, REST + JSON, miễn phí.
- •EPO OPS là nguồn có thẩm quyền nhất cho các họ bằng sáng chế quốc tế nhưng trả về XML và bị giới hạn tốc độ.
- •PatentsView (do USPTO tài trợ) rất tốt cho siêu dữ liệu và khử nhập nhằng nhưng thiếu yêu cầu bảo hộ toàn văn.
- •API Pick Patent Search bọc việc truy xuất ngữ nghĩa trên USPTO + EPO + WIPO + JPO + KIPO + CNIPA trong một endpoint POST duy nhất, JSON vào / JSON ra, 80 credit mỗi lần gọi.
Điều gì đã thay đổi và tại sao bài viết này tồn tại
Hai thứ đã hỏng trong hệ sinh thái API tìm kiếm bằng sáng chế giữa năm 2024 và 2026, và chúng hỏng cùng một lúc.
Thứ nhất, API tìm kiếm theo từ khóa của Google Patents Public Datasets — lựa chọn mặc định trên thực tế cho các nhà phát triển độc lập làm công việc tình trạng kỹ thuật đã biết và tình báo cạnh tranh — đã ngừng được duy trì. Tập dữ liệu patents-public-data của BigQuery vẫn còn đó cho phân tích hàng loạt, nhưng các endpoint đơn giản https://patents.googleapis.com/... vốn cung cấp năng lượng cho hầu hết các công cụ bằng sáng chế kiểu dự án cuối tuần đã biến mất. Hãy tìm "Google Patents API alternative 2026" và bạn sẽ thấy một trăm câu hỏi trên Stack Overflow và không có câu trả lời nào.
Thứ hai, USPTO đã gỡ bỏ Patent Examination Data System (PEDS) cũ vào cuối năm 2024 và đang di chuyển các endpoint hàng loạt còn lại sang Open Data Portal (ODP) mới trước ngày 29 tháng 5 năm 2026. Các pipeline scraping các phản hồi XML của PEDS bắt đầu hỏng vào đầu năm 2025; những đội không di chuyển kịp trước Q1 2026 giờ đang âm thầm hỏng.
Cả hai sự kiện đều xảy ra vào khoảng thời gian các startup AI-cho-sở-hữu-trí-tuệ (Solve Intelligence, Patlytics, NLPatent, IPRally, &AI) gọi được số vốn nghiêm túc — riêng Solve Intelligence đã chốt vòng Series B trị giá $40M cho tìm kiếm và soạn thảo bằng sáng chế bằng AI. Nhu cầu chưa bao giờ cao hơn thế; phía cung thì vừa mới trở nên rối rắm hơn.
Đây là sáu API thực sự hoạt động vào năm 2026, mỗi cái giỏi ở điểm gì và mỗi cái yếu ở đâu.
Sáu lựa chọn
1. USPTO Open Data Portal (ODP)
Bản thay thế chính thức của Hoa Kỳ cho PEDS. REST + JSON, miễn phí, bao phủ các đơn xin cấp bằng sáng chế, bằng sáng chế đã cấp và dữ liệu chuyển nhượng của United States Patent and Trademark Office. Có sẵn toàn văn. Tài liệu tại developer.uspto.gov.
Điểm mạnh: có thẩm quyền, miễn phí, bao phủ toàn văn. Điểm yếu: chỉ Hoa Kỳ (bạn vẫn sẽ cần EPO OPS hoặc các nguồn khác cho phạm vi quốc tế), các thay đổi lược đồ trong cửa sổ di chuyển đã làm hỏng một số pipeline, không có tìm kiếm ngữ nghĩa — chỉ từ khóa/Boolean.
2. EPO OPS (Open Patent Services)
API dành cho nhà phát triển của European Patent Office. Bao phủ EP, WO và nhiều hồ sơ quốc gia qua cơ sở dữ liệu INPADOC. Có thẩm quyền cho việc tra cứu họ bằng sáng chế quốc tế và dữ liệu PCT.
Điểm mạnh: độ bao phủ quốc tế tốt nhất, bao gồm tình trạng pháp lý và thông tin về họ. Điểm yếu: trả về XML (phân tích nặng), bậc miễn phí bị giới hạn ở 500MB/tuần, endpoint fulltext riêng, luồng OAuth cho các bậc cao hơn. Đường học tập dốc cho những người tích hợp lần đầu.
3. PatentsView
Công cụ nghiên cứu do USPTO tài trợ. Mạnh về siêu dữ liệu: khử nhập nhằng chủ sở hữu, hồ sơ nhà sáng chế, mạng lưới trích dẫn, nguồn tài trợ vì lợi ích chính phủ. Miễn phí.
Điểm mạnh: các thực thể sạch sẽ đã được khử nhập nhằng, REST + JSON dễ dùng. Điểm yếu: không có phần thân yêu cầu bảo hộ toàn văn, tập trung vào Hoa Kỳ, độ trễ so với các hồ sơ theo thời gian thực, không được tối ưu cho tìm kiếm tương đồng ngữ nghĩa.
4. Lens.org
Bộ tổng hợp bao phủ hơn 95 triệu bằng sáng chế từ hơn 100 khu vực tài phán cùng các công trình học thuật. Được các nhà phân tích sở hữu trí tuệ và nhà nghiên cứu học thuật sử dụng. Bậc học thuật miễn phí; bậc thương mại tính phí.
Điểm mạnh: độ bao phủ khu vực tài phán rộng nhất, liên kết bằng sáng chế với tài liệu học thuật, giao diện tốt cho việc con người theo dõi tiếp. Điểm yếu: giá thương mại không minh bạch, tìm kiếm ngữ nghĩa được tăng cường bằng từ khóa chứ không phải dựa trên embedding một cách nguyên bản.
5. PQAI (Project PQAI)
Dự án tìm kiếm bằng sáng chế mã nguồn mở do đội sở hữu trí tuệ của AT&T vận hành. Miễn phí, tương đồng ngữ nghĩa trên USPTO + EPO. Phổ biến với cộng đồng độc lập / r/LocalLLaMA — xem bài viết trên DEV.to "I posted my patent search AI to Reddit and got 65 upvotes" đã đưa góc này của hệ sinh thái ra ánh sáng.
Điểm mạnh: miễn phí, ưu tiên ngữ nghĩa, không cần khóa API cho khối lượng vừa phải. Điểm yếu: thời gian hoạt động ở mức nỗ lực tối đa, không có SLA, độ bao phủ khu vực tài phán nhỏ hơn, không có hỗ trợ thương mại.
6. API Pick Patent Search
Tìm kiếm ngữ nghĩa trên USPTO + EPO + WIPO + JPO + KIPO + CNIPA trong một lần gọi REST duy nhất. JSON vào / JSON ra, 80 credit mỗi lần gọi (~$0.08 theo $5 / 5,000 credit), chỉ tính phí khi thành công. Trả về tiêu đề, tóm tắt, đoạn trích, URL, khu vực tài phán và chủ sở hữu cho mỗi kết quả.
Điểm mạnh: một endpoint bao phủ tất cả các văn phòng chính, kết quả ngữ nghĩa được xếp hạng và định dạng sẵn cho LLM tiêu thụ, giá mỗi lần gọi có thể dự đoán. Điểm yếu: ít cấu hình được hơn so với EPO OPS trực tiếp cho các trường hợp biên về tình trạng pháp lý; nếu bạn cần phân tích tập dữ liệu hàng loạt, BigQuery vẫn tốt hơn các API tính theo lần gọi.
Đặt cạnh nhau
| USPTO ODP | EPO OPS | PatentsView | Lens.org | PQAI | API Pick | |
|---|---|---|---|---|---|---|
| Độ bao phủ | Chỉ Hoa Kỳ | EP + WO + nhiều nước qua INPADOC | Chỉ Hoa Kỳ | Hơn 100 khu vực tài phán | USPTO + EPO | USPTO + EPO + WIPO + JPO + KIPO + CNIPA |
| Yêu cầu bảo hộ toàn văn | Có | Có (endpoint riêng) | Không (chỉ siêu dữ liệu) | Có (thương mại) | Có | Có (đoạn trích) |
| Loại tìm kiếm | Từ khóa/Boolean | Từ khóa/Boolean | Lọc theo trường | Từ khóa + phân mặt | Ngữ nghĩa | Ngữ nghĩa |
| Định dạng | JSON | XML | JSON | JSON | JSON | JSON |
| Giá | Miễn phí | Miễn phí 500 MB/tuần + trả phí | Miễn phí | Học thuật miễn phí + trả phí | Miễn phí | $5 / 5,000 credit, 80/lần gọi |
| Phù hợp nhất | Nguồn cấp chính phủ Hoa Kỳ | Họ quốc tế & tình trạng pháp lý | Siêu dữ liệu chủ sở hữu/nhà sáng chế | Phân tích đa khu vực tài phán tổng hợp | Khám phá ngữ nghĩa mã nguồn mở | Tác nhân AI trong sản xuất, tình trạng kỹ thuật đã biết / FTO |
Mã hoạt động: cùng một truy vấn tình trạng kỹ thuật đã biết, sáu cách
Truy vấn ví dụ: "wireless charging coil with embedded ferrite for under-display sensors." Một câu hỏi thực có dạng FTO.
USPTO ODP
import requests
# Open Data Portal — keyword/Boolean
r = requests.get(
"https://api.uspto.gov/api/v1/patent/applications/search",
params={
"query": "wireless charging coil ferrite under-display",
"fields": "applicationNumber,inventionTitle,filingDate,abstractText",
"limit": 25,
},
)
print(r.json()["results"][:3])EPO OPS
import requests
from base64 import b64encode
# OAuth: token from Consumer Key + Secret
auth = b64encode(b"YOUR_KEY:YOUR_SECRET").decode()
token = requests.post(
"https://ops.epo.org/3.2/auth/accesstoken",
headers={"Authorization": f"Basic {auth}"},
data={"grant_type": "client_credentials"},
).json()["access_token"]
# Then search
r = requests.get(
"https://ops.epo.org/3.2/rest-services/published-data/search",
params={"q": 'ti="wireless charging coil ferrite"'},
headers={"Authorization": f"Bearer {token}", "Accept": "application/xml"},
)
# Returns XML — you'll need lxml or xmltodict
print(r.text[:500])PatentsView
import requests
r = requests.post(
"https://search.patentsview.org/api/v1/patent/",
headers={"X-Api-Key": "YOUR_KEY"},
json={
"q": {"_text_phrase": {"patent_title": "wireless charging coil"}},
"f": ["patent_id", "patent_title", "patent_date", "assignees"],
"o": {"size": 25},
},
)
print(r.json()["patents"][:3])Lens.org
import requests
# Lens uses Lucene-style queries; commercial endpoints require paid token
r = requests.post(
"https://api.lens.org/patent/search",
headers={"Authorization": "Bearer YOUR_TOKEN"},
json={
"query": {
"match": {
"full_text": "wireless charging coil ferrite under-display sensor"
}
},
"size": 25,
},
)
print(r.json()["data"][:3])PQAI
import requests
r = requests.get(
"https://api.projectpq.ai/patents/",
params={
"q": "wireless charging coil with embedded ferrite for under-display sensors",
"n": 10,
},
)
print(r.json()["results"][:3])API Pick Patent Search
import requests
r = requests.post(
"https://www.apipick.com/api/search/patents",
headers={"x-api-key": "pk_yourkey"},
json={
"query": "wireless charging coil with embedded ferrite for under-display sensors",
},
)
print(r.json()["results"][:3])
# Each result: { title, abstract, snippet, url, jurisdiction, assignee }
# Ranked by semantic similarity. 80 credits, only on HTTP 200.Cách chọn, theo tình huống sử dụng
Xu hướng của lĩnh vực này
AI-cho-sở-hữu-trí-tuệ là một trong những mảng phần mềm dọc chuyển động nhanh nhất hiện nay. Trong vòng 18 tháng, giả định rằng "tìm kiếm bằng sáng chế = nhập một truy vấn Boolean vào một giao diện" sẽ trông lỗi thời như "tìm kiếm mã = nhập regex vào grep". Các đội đang cho ra mắt sản phẩm hoạt động được ngày hôm nay là những đội đã trả cái giá di chuyển vào năm 2025 — thiết lập truy cập theo lập trình có khả năng phục hồi, xếp lớp truy xuất ngữ nghĩa và xây dựng một pipeline dọn dẹp cho sự xáo trộn lược đồ không thể tránh khỏi từ các nguồn công cộng.
Đối với hầu hết các tác nhân AI trong sản xuất, bạn không cần chọn một API duy nhất — bạn cần một lựa chọn mặc định hợp lý với giá dự đoán được và tùy chọn hạ xuống một nguồn cấp thấp hơn cho các trường hợp biên. Đó là lý do chúng tôi xây dựng API Pick Patent Search như một endpoint ngữ nghĩa duy nhất trên các văn phòng chính: nó bao phủ 95% khối lượng công việc của tác nhân và 5% còn lại có thể gọi trực tiếp EPO OPS hoặc USPTO ODP. Công cụ đồng hành URL Extract tiếp nối ở nơi mà bất kỳ công cụ nào trong số này bỏ dở — kéo về toàn văn của một hồ sơ cụ thể để phân tích yêu cầu bảo hộ sâu.
Câu hỏi thường gặp
API Google Patents Public Datasets có thực sự đã biến mất không?
Tập dữ liệu BigQuery vẫn còn tồn tại cho phân tích hàng loạt, nhưng endpoint tìm kiếm theo từ khóa mà các nhà phát triển đã dùng trong giai đoạn 2018-2022 không còn được duy trì hay ghi tài liệu nữa. Không có bản thay thế chính thức nào từ Google. Tìm kiếm web tại patents.google.com hoạt động cho con người nhưng không được thiết kế cho truy cập theo lập trình — việc scraping nó sẽ kích hoạt cơ chế bảo vệ chống bot trong vòng vài phút.
Giải pháp thay thế nào cho tôi yêu cầu bảo hộ toàn văn?
USPTO Open Data Portal trả về toàn văn cho các hồ sơ Hoa Kỳ (chi tiết kiểu như 10-Q). EPO OPS trả về toàn văn cho các hồ sơ châu Âu qua một endpoint fulltext riêng. PatentsView chỉ cho bạn siêu dữ liệu — không có phần thân yêu cầu bảo hộ. API Pick Patent Search trả về tiêu đề, tóm tắt, yêu cầu bảo hộ và một đoạn trích được định dạng sẵn cho LLM tiêu thụ trên tất cả các văn phòng chính.
Cách đơn giản nhất để thực hiện tìm kiếm quyền tự do khai thác (FTO) theo lập trình là gì?
Vòng lặp FTO tối thiểu khả thi: (1) trích xuất các khái niệm kỹ thuật chính từ mô tả sáng chế của bạn, (2) tìm kiếm ngữ nghĩa trên một kho ngữ liệu bằng sáng chế đa khu vực tài phán, (3) với các kết quả có độ tương đồng cao, kéo về toàn bộ yêu cầu bảo hộ và chạy kiểm tra mức độ liên quan bằng một LLM, (4) gom cụm theo họ bằng sáng chế để loại trùng các tương đương. API Pick Patent Search bao phủ các bước 2-3 trong một lần gọi trên USPTO + EPO + WIPO; kết hợp với URL Extract hoặc tra cứu dữ kiện công ty để có bối cảnh về chủ sở hữu.
Một tìm kiếm FTO thực sự tốn bao nhiêu ở mỗi lựa chọn?
USPTO ODP và PatentsView miễn phí nhưng bị giới hạn tốc độ và đòi hỏi rất nhiều mã kết dính. EPO OPS có một bậc miễn phí (500MB/tuần) cộng với bậc trả phí; việc phân tích XML khá nặng. Lens.org có một bậc học thuật miễn phí và bậc thương mại trả phí. PQAI miễn phí cho nghiên cứu học thuật / nghiệp dư. API Pick Patent Search tốn 80 credit mỗi lần gọi (~$0.08 theo giá niêm yết) bao phủ tất cả các văn phòng chính trong một yêu cầu duy nhất — chi phí kỹ thuật vượt trội so với chi phí API trong mọi trường hợp.
Tôi có thể dựa vào những công cụ này cho các ý kiến pháp lý không?
Không có đầu ra API nào nên được trình bày như một ý kiến pháp lý. Việc tìm kiếm bằng sáng chế hỗ trợ công việc của luật sư; chúng không thay thế được. Đối với tình trạng kỹ thuật đã biết ở cấp độ tranh tụng (ví dụ vô hiệu hóa trước PTAB), hãy kết hợp khả năng thu hồi do API dẫn dắt với việc rà soát độ chính xác do luật sư chủ trì và các hãng tìm kiếm được chứng nhận. Đối với các quy trình tình báo cạnh tranh và của đội ngũ kỹ thuật, tìm kiếm theo lập trình là công cụ phù hợp.
Các API dùng trong bài viết này
Sarah Choy là CEO của API Pick. Cô viết về việc xây dựng các API sẵn sàng cho production cho AI agent và quy trình LLM.