एक नई कंपनी, दीप कोगिटोखुले तौर पर उपलब्ध एआई मॉडल के एक परिवार के साथ चुपके से उभरा है, जिसे “तर्क” और गैर-पुनर्जीवित मोड के बीच स्विच किया जा सकता है।

Openai जैसे तर्क मॉडल O1 गणित और भौतिकी जैसे डोमेन में महान वादा दिखाया है, जटिल समस्याओं के माध्यम से कदम से कदम के माध्यम से काम करके प्रभावी रूप से तथ्य की जाँच करने की उनकी क्षमता के लिए धन्यवाद। यह तर्क एक लागत पर आता है, हालांकि: उच्च कंप्यूटिंग और विलंबता। इसीलिए एन्थ्रोपिक जैसी प्रयोगशालाएं “हाइब्रिड” मॉडल आर्किटेक्चर का पीछा कर रहे हैं जो मानक, गैर-पुनर्जीवित तत्वों के साथ तर्क घटकों को जोड़ते हैं। हाइब्रिड मॉडल अधिक चुनौतीपूर्ण प्रश्नों पर विचार करते हुए अतिरिक्त समय बिताते हुए सरल प्रश्नों का उत्तर दे सकते हैं।

डीप कोगिटो के सभी मॉडल, जिसे कॉगिटो 1 कहा जाता है, हाइब्रिड मॉडल हैं। कोगिटो का दावा है कि वे मेटा और चीनी एआई स्टार्टअप के मॉडल सहित एक ही आकार के सर्वश्रेष्ठ खुले मॉडल को बेहतर बनाते हैं दीपसेक

“प्रत्येक मॉडल सीधे जवाब दे सकता है […] या जवाब देने से पहले आत्म-प्रतिबिंब (जैसे कि तर्क मॉडल), “कंपनी एक ब्लॉग पोस्ट में समझाया गया। “[All] लगभग 75 दिनों में एक छोटी टीम द्वारा विकसित किया गया था। ”

Cogito 1 मॉडल 3 बिलियन मापदंडों से लेकर 70 बिलियन मापदंडों तक, और Cogito का कहना है कि 671 बिलियन मापदंडों तक के मॉडल आने वाले हफ्तों और महीनों में उनके साथ जुड़ेंगे। पैरामीटर मोटे तौर पर एक मॉडल की समस्या-समाधान कौशल के अनुरूप हैं, अधिक पैरामीटर आमतौर पर बेहतर होते हैं।

Cogito 1 को खरोंच से विकसित नहीं किया गया था, स्पष्ट होने के लिए। डीप कॉगिटो ने मेटा के ओपन लामा और अलीबाबा के क्यूवेन मॉडल के शीर्ष पर अपना खुद का बनाने के लिए बनाया। कंपनी का कहना है कि उसने बेस मॉडल के प्रदर्शन को बढ़ावा देने और टॉगल करने योग्य तर्क को सक्षम करने के लिए उपन्यास प्रशिक्षण दृष्टिकोणों को लागू किया।

कॉगिटो के आंतरिक बेंचमार्किंग के परिणामों के अनुसार, सबसे बड़ा कॉगिटो 1 मॉडल, कॉगिटो 70 बी, तर्क के साथ कुछ गणित और भाषा मूल्यांकन पर डीपसेक के आर 1 रीजनिंग मॉडल को तर्क देता है। कॉगिटो 70 बी तर्क के साथ अक्षम भी मेटा के हाल ही में जारी लामा 4 स्काउट मॉडल को लाइवबेंच पर एक सामान्य-उद्देश्य एआई परीक्षण पर ग्रहण करता है।

प्रत्येक Cogito 1 मॉडल क्लाउड प्रदाताओं आतिशबाजी AI और साथ में API के माध्यम से डाउनलोड या उपयोग के लिए उपलब्ध है।

दीप कोगिटो
अन्य लोकप्रिय खुले तौर पर उपलब्ध एआई मॉडल की तुलना में कोगिटो 1 का प्रदर्शनछवि क्रेडिट:दीप कोगिटो

“वर्तमान में, हम अभी भी शुरुआती चरणों में हैं [our] स्केलिंग कर्व, आमतौर पर पारंपरिक बड़े भाषा मॉडल पोस्ट/निरंतर प्रशिक्षण के लिए आरक्षित गणना के एक अंश का उपयोग किया है, “अपने ब्लॉग पोस्ट में कॉगिटो ने लिखा है।” आगे बढ़ते हुए, हम आत्म-सुधार के लिए पूरक पोस्ट-ट्रेनिंग दृष्टिकोणों की जांच कर रहे हैं। “

कैलिफोर्निया राज्य के साथ फाइलिंग के अनुसारसैन फ्रांसिस्को स्थित डीप कोगिटो की स्थापना जून 2024 में हुई थी। कंपनी की लिंक्डइन पेज दो सह-संस्थापकों, ड्रिशन अरोड़ा और ध्रुव मल्होत्रा ​​को सूचीबद्ध करता है। Malhotra पहले Google AI LAB DEEPMIND में एक उत्पाद प्रबंधक थे, जहां उन्होंने जेनेरिक सर्च टेक्नोलॉजी पर काम किया था। अरोड़ा Google में एक वरिष्ठ सॉफ्टवेयर इंजीनियर था।

दीप कॉगिटो, जिनके बैकर्स में साउथ पार्क कॉमन्स शामिल हैं, पिचबुक के अनुसारमहत्वाकांक्षी रूप से “सामान्य अधीक्षण” का निर्माण करना है। कंपनी के संस्थापक वाक्यांश का मतलब एआई को समझते हैं जो अधिकांश मनुष्यों की तुलना में बेहतर कार्यों को कर सकते हैं और “पूरी तरह से नई क्षमताओं को उजागर कर सकते हैं जिनकी हम अभी तक कल्पना नहीं कर रहे हैं।”



Source link