एआई के लिए एलन इंस्टीट्यूट (Ai2) है ओपन-सोर्स एआई मॉडल का एक नया सेट जारी करना और कृत्रिम बुद्धिमत्ता की दुनिया के एक महत्वपूर्ण लेकिन पहले से रहस्यमय कोने पर प्रकाश डालने के प्रयास में संबंधित संसाधन।
एआई2 की तुलु पहल का फोकस प्रशिक्षण के बाद है – अपनी क्षमताओं को बढ़ाने और इसे विशिष्ट कार्यों और वास्तविक दुनिया के अनुप्रयोगों के लिए उपयुक्त बनाने के लिए प्रारंभिक प्रशिक्षण प्रक्रिया के बाद एक भाषा मॉडल को परिष्कृत करने की प्रक्रिया।
Ai2 का कहना है कि उसका नया तुलु 3 मॉडल प्रतिद्वंद्वी है और कुछ मामलों में गणित, निर्देश पालन और चैट क्षमताओं जैसे कौशल के लिए बेंचमार्क पर OpenAI, मिस्ट्रल, Google और अन्य जैसी कंपनियों के मालिकाना मॉडल से आगे निकल जाता है।
सिएटल स्थित एआई गैर-लाभकारी संस्था है तुलु 3 मॉडल जारी करना गुरुवार को, प्रशिक्षण के बाद की प्रक्रिया में उपयोग किए जाने वाले डेटा, कोड और बुनियादी ढांचे के साथ, इसे किसी के भी उपयोग और निर्माण के लिए सुलभ बनाया जा सकता है।
तुलु 3 रिलीज का एक बड़ा लक्ष्य अन्य एआई शोधकर्ताओं और इंजीनियरों को प्रशिक्षण के बाद अधिक प्रभावी प्रदर्शन करने के लिए सामग्री और नुस्खा देना है। तुलु 3 मॉडल पर आधारित एक चैटबॉट है यहाँ उपलब्ध है – अपने काम पर अधिक जनता का ध्यान आकर्षित करने के लिए अपनी तकनीक का डेमो जारी करने की Ai2 की नई रणनीति का हिस्सा।
“प्रशिक्षण के बाद वास्तव में महत्वपूर्ण है,” कहा हन्ना हाजीशिरज़ीएआई2 के प्राकृतिक भाषा प्रसंस्करण के वरिष्ठ निदेशक ने इस सप्ताह एक मीडिया ब्रीफिंग में एआई भाषा मॉडल को उपयोगी बनाने में प्रशिक्षण के बाद की महत्वपूर्ण भूमिका का वर्णन किया।
यह भी एक चुनौतीपूर्ण प्रक्रिया है, उन्होंने समझाया, यह देखते हुए कि प्रशिक्षण के बाद एआई विशिष्ट क्षमताएं देने से मॉडल उन सामान्य क्षमताओं को भूल जाते हैं जो उन्होंने पूर्व-प्रशिक्षण प्रक्रिया के दौरान प्राप्त की थीं। और अब तक, प्रशिक्षण के बाद का चरण उद्योग में एक बारीकी से संरक्षित रहस्य रहा है, जिससे बंद मॉडलों को लाभ मिलता है।
तुलु 3 रिलीज के साथ, विचार व्यापक समुदाय को स्क्रैच से पूरी तरह से पूर्व-प्रशिक्षण मॉडल के लिए आवश्यक बड़े कंप्यूटिंग संसाधनों के बिना उच्च गुणवत्ता वाले पोस्ट-प्रशिक्षित मॉडल को समझने और बनाने में सक्षम बनाना है।
“प्रशिक्षण के बाद इस तरह का जादुई ब्लैक-बॉक्स चरण होता है जो मॉडलों को सामान्य क्षमता खोए बिना कुछ कार्यों में वास्तव में अच्छा बनाता है,” ने कहा। सोफी लेब्रेक्टAi2 मुख्य परिचालन अधिकारी। उन्होंने कहा कि तुलु 3 रिलीज लोगों को उच्च-गुणवत्ता, कार्य-विशिष्ट मॉडल बनाने के लिए “एक बड़ा गेम चेंजर” होने का वादा करती है।
पिछले तुलु मॉडल से मुख्य अंतरों में डेटा क्यूरेशन में प्रगति, एक अधिक कठोर मूल्यांकन ढांचा, और मल्टी-स्टेज प्रशिक्षण प्रक्रिया सहित एल्गोरिदम और बुनियादी ढांचे में सुधार शामिल हैं।
“ऐसी कई चीजें हैं जहां यह लगभग आश्चर्यजनक है कि यदि आप इसे सही डेटा देते हैं तो यह कितना आसान है,” उन्होंने कहा नाथन लैंबर्टएआई2 मशीन लर्निंग वैज्ञानिक, एआई2 द्वारा तुलु 3 मॉडल के साथ लागू की गई प्रगति का वर्णन कर रहे हैं।
Ai2 की स्थापना 2014 में दिवंगत Microsoft सह-संस्थापक पॉल एलन द्वारा की गई थी। इसका नेतृत्व पिछले वर्ष से किया जा रहा है अली फरहादीजिन्होंने पहले सीईओ के रूप में Ai2 स्पिनआउट Xnor.ai की स्थापना और नेतृत्व किया था, और 2020 में इसे Apple को बेच दिया अनुमानित $200 मिलियन का सौदा, जो संस्थान की अब तक की सबसे बड़ी व्यावसायिक सफलताओं में से एक है।
इस साल की शुरुआत में, Ai2 रिलीज़ हुई नया मल्टीमॉडल कृत्रिम बुद्धिमत्ता मॉडलडब किया गया मुँहजो दृश्य डेटा के साथ नए तरीकों से काम करता है। ऐ2 अपना ओपन लैंग्वेज मॉडल जारी कियाया एल्मपिछले साल फरवरी में, जेनेरिक एआई मॉडल के उदय में अधिक पारदर्शिता लाने के एक बड़े प्रयास का हिस्सा।
Ai2 का वाशिंगटन विश्वविद्यालय के एलन स्कूल ऑफ कंप्यूटर साइंस एंड इंजीनियरिंग से संबंध है, जहां हाजीशिरज़ी जैसे Ai2 अनुसंधान नेताओं के पास भी संकाय पद हैं।
तुलु 3 पोस्ट-प्रशिक्षित मॉडल और संबंधित संसाधनों के लिंक देखें यहाँ.