[ blog · tutorial ]12 min read

निवेश रिसर्च एजेंट कैसे बनाएं: बाज़ार, फंडामेंटल, SEC और आर्थिक डेटा एक ही API में

Q: एक निवेश-रिसर्च एजेंट को वास्तव में किस डेटा की ज़रूरत होती है?

पाँच परतें। (1) रियल-टाइम बाज़ार — कीमतें, क्रिप्टो, forex, ETF, सबसे ज़्यादा हिलने वाले, 'अभी यह क्या कर रहा है' वाले सवाल के लिए। (2) फंडामेंटल — बैलेंस शीट, आय विवरण, नकदी प्रवाह, लाभांश, insider लेनदेन। (3) SEC filings — 10-K/10-Q/8-K टेक्स्ट और गुणात्मक संकेतों के लिए earnings transcripts। (4) आर्थिक संकेतक — मैक्रो पृष्ठभूमि के लिए FRED, BLS, World Bank, IMF। (5) समाचार — समयोचित उत्प्रेरक। ज़्यादातर एजेंट इसलिए विफल होते हैं क्योंकि उनके पास कीमतें हैं पर फंडामेंटल नहीं, या फंडामेंटल हैं पर मैक्रो संदर्भ नहीं।

Sarah Choyप्रकाशित 16 जून 202612 मिनट पढ़ें

एक निवेश-रिसर्च एजेंट को पाँच अलग डेटा परतें चाहिए — कीमतें, फंडामेंटल, filings, मैक्रो और समाचार — हर एक आमतौर पर एक अलग वेंडर, key और schema। यहाँ बताया है कि कैसे इन पाँचों को एक ही endpoint सेट के पीछे जोड़ें, काम करने वाले कोड और लागत के गणित के साथ।

TL;DR

•एक उपयोगी फाइनेंस एजेंट को पाँच डेटा परतें चाहिए: रियल-टाइम बाज़ार (कीमतें), कंपनी फंडामेंटल (स्टेटमेंट), SEC filings, आर्थिक संकेतक, और समाचार। अलग-अलग वेंडरों से जोड़ने पर यह 5 कॉन्ट्रैक्ट, 5 key और 5 schema हैं।
•API Pick इन पाँचों को एकरूप JSON search endpoint के रूप में देता है — /search/markets, /search/financials, /search/sec, /search/economic, /search/news — साथ ही पूरे दस्तावेज़ों के लिए /extract। एक key, LLM tool calling के लिए पहले से तैयार।
•एजेंट पैटर्न: प्रासंगिक endpoint को tools के रूप में समानांतर में चलाएं, JSON को मर्ज करें, और मॉडल को आँकड़े मनगढ़ंत बनाने के बजाय आधारित डेटा पर तर्क करने दें।
•Credit की कीमत केवल-सफलता-पर है: markets 120, financials 200, sec 120, economic 50, news 15 प्रति कॉल। एक सामान्य मल्टी-टूल रिसर्च टर्न गहराई के अनुसार $0.01–$0.10 से काफ़ी कम खर्च करता है।
•Build-vs-buy: खुद Polygon + एक फंडामेंटल वेंडर + SEC EDGAR + FRED + एक समाचार API जोड़ना हफ्तों का एकीकरण और 5 मासिक बिल हैं; एकल-endpoint मार्ग एक दिन का है।

पाँच-परत की समस्या

किसी LLM से पूछें "क्या NVIDIA अभी महँगी है?" और वह पूरे आत्मविश्वास से एक P/E ratio गढ़ देगा। समाधान बड़ा मॉडल नहीं है — grounding है। एक रिसर्च एजेंट जो भरोसा कमाता है, उसे पाँच परतों में जीवंत, उद्धृत डेटा खींचना होता है, फिर उस पर तर्क करना होता है:

बाज़ार — वर्तमान कीमत, market cap, और यह कैसे हिला। प्रासंगिक होने पर क्रिप्टो, forex, ETF और दिन के सबसे ज़्यादा हिलने वाले।
फंडामेंटल — बैलेंस शीट, आय विवरण, नकदी प्रवाह, लाभांश और insider लेनदेन। "क्या व्यवसाय वास्तव में स्वस्थ है" वाली परत।
SEC filings — 10-K जोखिम कारक, 10-Q विवरण, 8-K घटनाएँ, earnings-call की भाषा। वह गुणात्मक आयाम जो आँकड़े छोड़ देते हैं।
आर्थिक संकेतक — FRED, BLS, World Bank और IMF से ब्याज दरें, मुद्रास्फीति, रोज़गार, GDP। वह मैक्रो पृष्ठभूमि जिसके भीतर हर थीसिस बैठती है।
समाचार — समयोचित उत्प्रेरक: एक downgrade, एक उत्पाद लॉन्च, एक नियामक कार्रवाई।

अलग-अलग वेंडरों से जोड़ने पर, यह पाँच कॉन्ट्रैक्ट, पाँच API key, पाँच rate-limit व्यवस्थाएँ और पाँच response schema हैं जिन्हें किसी मॉडल के छूने से पहले आपको सामान्य करना पड़ता है। एकीकरण ही वह जगह है जहाँ फाइनेंस-एजेंट परियोजनाएँ अटकती हैं।

एक endpoint सेट, पाँच परतें

API Pick हर परत को एक एकरूप JSON search endpoint के रूप में देता है, ताकि एजेंट एक key और एक response आकार से बात करे:

Markets Search — वैश्विक और US इक्विटी, क्रिप्टो, forex, ETF, फंड, कमोडिटी, और US बाज़ार के सबसे ज़्यादा हिलने वाले।
Financials Search — बैलेंस शीट, आय विवरण, नकदी प्रवाह, लाभांश, insider लेनदेन।
SEC Filings Search — 10-K/10-Q/8-K, earnings transcripts, equity आँकड़े।
Economic Data Search — FRED, BLS, World Bank, IMF, USAspending, Destatis।
News Search — प्रमुख मीडिया में दिनांक-फ़िल्टर किए गए समाचार।
Extract — जब snippet पर्याप्त न हो तो पूरे filing या लेख को साफ़ markdown में खींचें।

एजेंट आर्किटेक्चर

हर endpoint को एक tool के रूप में पंजीकृत करें। जब कोई सवाल आता है, एजेंट तय करता है कि उसे कौन-सी परतें चाहिए, उन्हें समानांतर में कॉल करता है, JSON को मर्ज करता है, और आधारित परिणाम पर तर्क करता है। किसी ticker के सवाल पर markets + फंडामेंटल + समाचार छूता है; "सेक्टर कैसे स्थित है" वाला सवाल economic + समाचार + कुछ comparables छूता है।

import asyncio, httpx, os

API = "https://api.apipick.com/v1"
HEADERS = {"x-api-key": os.environ["APIPICK_KEY"], "Content-Type": "application/json"}

async def search(client, path, query, **kw):
    r = await client.post(f"{API}/{path}", headers=HEADERS,
                          json={"query": query, **kw})
    r.raise_for_status()
    return r.json()["results"]

async def research(ticker: str):
    async with httpx.AsyncClient(timeout=30) as c:
        markets, fundamentals, filings, macro, news = await asyncio.gather(
            search(c, "search/markets",    f"{ticker} price and market cap"),
            search(c, "search/financials", f"{ticker} latest balance sheet and cash flow"),
            search(c, "search/sec",        f"{ticker} 10-K risk factors", end_date="2026-06-16"),
            search(c, "search/economic",   "US interest rates and inflation latest"),
            search(c, "search/news",       f"{ticker} latest news", end_date="2026-06-16"),
        )
    return {"markets": markets, "fundamentals": fundamentals,
            "filings": filings, "macro": macro, "news": news}

# Feed the merged JSON back to your LLM as grounding, with the source URLs,
# and ask it to synthesize — never to recall numbers.
context = asyncio.run(research("NVDA"))

हर परिणाम के साथ एक source URL होता है। इन्हें अंतिम उत्तर तक पहुँचाएं ताकि कोई मानव हर दावे का ऑडिट कर सके — और ताकि एजेंट का आउटपुट उद्धरण योग्य हो, जो उसे एक वास्तविक वर्कफ़्लो में उपयोगी बनाता है।

Build बनाम buy

	इसे खुद असेंबल करें	API Pick
वेंडर / keys	~5 (Polygon, फंडामेंटल, EDGAR, FRED, समाचार)	1
Response आकार	5 सामान्य करने हैं	1 JSON आकार
पहले एजेंट तक का समय	हफ्तों का एकीकरण	एक दिन
बिलिंग	5 मासिक सदस्यताएँ	प्रति-कॉल, केवल सफलता पर
LLM-तैयार	आप हर एक को पूर्व-आकार देते हैं	पूर्व-आकारित snippets + source URLs

एक ही प्रकार के डेटा के लिए, सीधे जाना उचित है। ऐसे एजेंट के लिए जिसे पाँचों चाहिए और जो अप्रत्याशित रूप से एक्सप्लोर करता है, एकल-endpoint मार्ग एक दिन में लॉन्च होता है और तभी बिल करता है जब कोई कॉल सफल होती है।

यह क्या संभव बनाता है

वही पाँच tools ticker lookup से कहीं अधिक को शक्ति देते हैं: earnings-season briefing एजेंट, फंडामेंटल में आधारित sector screens, मैक्रो-जागरूक पोर्टफोलियो टिप्पणी, और diligence सहायक जो Extract के ज़रिए असली 10-K पढ़ते हैं। पैटर्न हमेशा एक जैसा है — आधारित tool कॉल, समानांतर पुनर्प्राप्ति, स्रोतों के साथ वास्तविक डेटा पर संश्लेषण।

एक मुफ़्त key (100 credits, बिना कार्ड) से शुरू करें और अपनी पसंद के एजेंट framework में पाँचों tools जोड़ें। उसके बाद यह prompt-इंजीनियरिंग है, plumbing नहीं।

अक्सर पूछे जाने वाले प्रश्न

एक निवेश-रिसर्च एजेंट को वास्तव में किस डेटा की ज़रूरत होती है?

पाँच परतें। (1) रियल-टाइम बाज़ार — कीमतें, क्रिप्टो, forex, ETF, सबसे ज़्यादा हिलने वाले, 'अभी यह क्या कर रहा है' वाले सवाल के लिए। (2) फंडामेंटल — बैलेंस शीट, आय विवरण, नकदी प्रवाह, लाभांश, insider लेनदेन। (3) SEC filings — 10-K/10-Q/8-K टेक्स्ट और गुणात्मक संकेतों के लिए earnings transcripts। (4) आर्थिक संकेतक — मैक्रो पृष्ठभूमि के लिए FRED, BLS, World Bank, IMF। (5) समाचार — समयोचित उत्प्रेरक। ज़्यादातर एजेंट इसलिए विफल होते हैं क्योंकि उनके पास कीमतें हैं पर फंडामेंटल नहीं, या फंडामेंटल हैं पर मैक्रो संदर्भ नहीं।

सीधे Polygon, FRED और SEC EDGAR को क्यों न कॉल करें?

आप कर सकते हैं — और एक ही प्रकार के डेटा के लिए यह ठीक है। दिक्कत यह है कि एजेंट को पाँचों चाहिए: यानी पाँच वेंडर, पाँच auth स्कीम, पाँच rate-limit व्यवस्थाएँ, पाँच response आकार जिन्हें LLM के उपयोग से पहले आपको सामान्य करना पड़ता है, और पाँच बिल। एकल-endpoint दृष्टिकोण एक छोटे प्रति-कॉल प्रीमियम के बदले एक key, एक JSON आकार और केवल-सफलता-पर बिलिंग देता है — जो एक्सप्लोरेटरी मल्टी-टूल कॉल करने वाले एजेंट के लिए आमतौर पर सस्ता और लॉन्च करने का कहीं तेज़ रास्ता होता है।

मैं LLM को वित्तीय आँकड़े मनगढ़ंत बनाने से कैसे रोकूँ?

मॉडल को कभी भी स्मृति से आँकड़े बनाने न दें। हर डेटा स्रोत को एक tool बनाएं, एजेंट को इसे कॉल करने के लिए बाध्य करें, और लौटाए गए JSON को grounding के रूप में वापस पास करें। मॉडल का काम पुनर्प्राप्त मूल्यों पर तर्क और संश्लेषण करना है, उन्हें याद करना नहीं। हर परिणाम का source URL उद्धृत करें ताकि आउटपुट ऑडिट योग्य हो — यही उत्तर को मानव समीक्षक के लिए भरोसेमंद बनाता है।

क्या आउटपुट वास्तविक ट्रेडिंग या सलाह के लिए उपयुक्त है?

नहीं। retrieval API आउटपुट सूचनात्मक है। यह किसी विश्लेषक या एजेंट के तर्क को वास्तविक डेटा में आधारित करता है; यह निवेश सलाह नहीं है और इसे योग्य मानव और उचित जोखिम नियंत्रण के बिना स्वचालित ट्रेडिंग संकेत के रूप में उपयोग नहीं किया जाना चाहिए। एजेंट को एक रिसर्च त्वरक मानें, निर्णयकर्ता नहीं।

एक रिसर्च टर्न की लागत कितनी है?

बिलिंग प्रति सफल कॉल है: markets 120 credits, financials 200, sec 120, economic 50, news 15 (1000 credits ≈ $1)। एक केंद्रित टर्न जो markets + फंडामेंटल + समाचार को छूता है ~335 credits (~$0.34); एक हल्का मैक्रो+समाचार टर्न ~65 credits है। आप केवल HTTP 200 पर भुगतान करते हैं, इसलिए विफल या खाली कॉल कुछ खर्च नहीं करतीं — जो तब मायने रखता है जब एजेंट एक्सप्लोर करता है।