मिस्ट्राल गुरुवार को मिस्ट्रल ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) एप्लिकेशन प्रोग्रामिंग इंटरफेस (API) का परिचय दिया। आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल पीडीएफ दस्तावेजों का विश्लेषण और प्रसंस्करण करने और इसे ए-तैयार पाठ प्रारूप जैसे कि मार्कडाउन या रॉ टेक्स्ट फ़ाइल में परिवर्तित करने में सक्षम है। उपकरण उन्हें AI मॉडल के लिए सुपाच्य बनाने के लिए PDFS से डेटा निकालने में सक्षम है। पेरिस स्थित एआई फर्म ने दावा किया कि मिस्ट्रल ओसीआर एपीआई डेवलपर्स को पीडीएफ फाइलों के लिए एआई एप्लिकेशन बनाने के साथ-साथ उन्हें नए एआई मॉडल को प्रशिक्षित करने के लिए डेटासेट बनाने की अनुमति देगा।

मिस्ट्रल ओसीआर एपीआई ने पेश किया

पीडीएफ दस्तावेज एआई मॉडल के लिए एक अनूठी चुनौती देते हैं। इस फ़ाइल प्रारूप की सामग्री को पारंपरिक पुनर्प्राप्ति-अगस्त पीढ़ी (आरएजी) तकनीकों का उपयोग करके बड़ी भाषा मॉडल (एलएलएम) द्वारा एक्सेस नहीं किया जा सकता है क्योंकि डेटा को उनके द्वारा संसाधित नहीं किया जा सकता है। उदाहरण के लिए, यदि आप जानकारी का एक टुकड़ा खोजने के लिए अपने लैपटॉप में पीडीएफ दस्तावेजों के माध्यम से स्कैन करने के लिए एआई एप्लिकेशन से पूछते हैं, तो ऐसा करने के लिए संघर्ष हो सकता है।

इसका मतलब यह है कि एआई अनुप्रयोगों का निर्माण करने वाले डेवलपर्स पीडीएफ-विश्लेषण क्षमता की पेशकश में सीमित होंगे। जबकि Google के नोटबुक, Adobe के AI सहायक, और कई अन्य उपकरण इस चुनौती को दूर करने के लिए विशेष OCR टूल का उपयोग करते हैं, ओपन-सोर्स समुदाय में डेवलपर्स के पास उच्च-दक्षता वाले उपकरण तक पहुंच नहीं है।

Mistral OCR API डेवलपर्स को A-तैयार प्रारूप में PDF डेटा निकालने की अनुमति देकर इस चुनौती को हल करता है। कंपनी एक न्यूज़ रूम में दावा करती है डाक यह उपकरण मीडिया, पाठ, तालिकाओं और उच्च सटीकता के साथ समीकरणों सहित दस्तावेजों में अलग -अलग तत्वों को समझ सकता है। एक बार विश्लेषण करने के बाद, यह मार्कडाउन या कच्चे पाठ फ़ाइल प्रारूप में जानकारी को निकाल और प्रस्तुत कर सकता है।

AI मॉडल तब इस निकाले गए पाठ का उपयोग कर सकते हैं क्योंकि इनपुट और RAG सिस्टम उन्हें आसानी से एक्सेस कर सकते हैं और उनके बारे में प्रश्नों का उत्तर दे सकते हैं। “मिस्ट्रल ओसीआर जटिल दस्तावेज़ तत्वों को समझने में उत्कृष्टता प्राप्त करता है, जिसमें इंटरलेव्ड इमेजरी, गणितीय अभिव्यक्तियों, टेबल और एडवांस्ड लेआउट जैसे लेटेक्स फॉर्मेटिंग शामिल हैं। मॉडल चार्ट, ग्राफ़, समीकरणों और आंकड़ों के साथ वैज्ञानिक कागजात जैसे समृद्ध दस्तावेजों की गहरी समझ को सक्षम बनाता है, ”पोस्ट में कहा गया है।

कंपनी ने दावा किया कि मिस्ट्रल ओसीआर एक नोड पर 2,000 पृष्ठ प्रति मिनट तक की प्रक्रिया कर सकता है। एपीआई भी डेवलपर्स को फ़ंक्शन कॉलिंग टूल और एआई एजेंटों के निर्माण के लिए एक प्रॉम्प्ट, और चेन आउटपुट के रूप में दस्तावेज़ का उपयोग करने देता है।

आंतरिक परीक्षण के आधार पर, “टेक्स्ट-ओनली” दस्तावेजों के लिए Google दस्तावेज़ AI, Azure OCR, और GPT-4O संस्करण 2024-11-20 जैसे मिस्ट्रल OCR से बेहतर प्रदर्शन किए गए। इसने बहुभाषी क्षमताओं में Google और Azure को भी बेहतर बनाया।

मॉडल की क्षमता की कोशिश करने के इच्छुक लोग मिस्ट्रल के ले चैट प्लेटफॉर्म पर जा सकते हैं। एपीआई को ला प्लेटफॉर्म से एक्सेस किया जा सकता है।

बार्सिलोना में मोबाइल वर्ल्ड कांग्रेस में सैमसंग, Xiaomi, Realme, Oneplus, Oppo और अन्य कंपनियों के नवीनतम लॉन्च और समाचारों के विवरण के लिए, हमारी यात्रा करें MWC 2025 हब


डोनाल्ड ट्रम्प ने रणनीतिक बिटकॉइन रिजर्व की स्थापना की, जब्त की गई संपत्ति का उपयोग करते हुए क्रिप्टो स्टॉकपाइल

Source link