एआई2 का नया तुलु 3 मॉडल ओपन-सोर्स एआई पोस्ट-ट्रेनिंग के लिए सफलता में तकनीकी दिग्गजों को टक्कर देता है

द्वारा

21 नवम्बर 2024

एआई के लिए एलन इंस्टीट्यूट (Ai2) है ओपन-सोर्स एआई मॉडल का एक नया सेट जारी करना और कृत्रिम बुद्धिमत्ता की दुनिया के एक महत्वपूर्ण लेकिन पहले से रहस्यमय कोने पर प्रकाश डालने के प्रयास में संबंधित संसाधन।

एआई2 की तुलु पहल का फोकस प्रशिक्षण के बाद है – अपनी क्षमताओं को बढ़ाने और इसे विशिष्ट कार्यों और वास्तविक दुनिया के अनुप्रयोगों के लिए उपयुक्त बनाने के लिए प्रारंभिक प्रशिक्षण प्रक्रिया के बाद एक भाषा मॉडल को परिष्कृत करने की प्रक्रिया।

Ai2 का कहना है कि उसका नया तुलु 3 मॉडल प्रतिद्वंद्वी है और कुछ मामलों में गणित, निर्देश पालन और चैट क्षमताओं जैसे कौशल के लिए बेंचमार्क पर OpenAI, मिस्ट्रल, Google और अन्य जैसी कंपनियों के मालिकाना मॉडल से आगे निकल जाता है।

सिएटल स्थित एआई गैर-लाभकारी संस्था है तुलु 3 मॉडल जारी करना गुरुवार को, प्रशिक्षण के बाद की प्रक्रिया में उपयोग किए जाने वाले डेटा, कोड और बुनियादी ढांचे के साथ, इसे किसी के भी उपयोग और निर्माण के लिए सुलभ बनाया जा सकता है।

तुलु 3 रिलीज का एक बड़ा लक्ष्य अन्य एआई शोधकर्ताओं और इंजीनियरों को प्रशिक्षण के बाद अधिक प्रभावी प्रदर्शन करने के लिए सामग्री और नुस्खा देना है। तुलु 3 मॉडल पर आधारित एक चैटबॉट है यहाँ उपलब्ध है – अपने काम पर अधिक जनता का ध्यान आकर्षित करने के लिए अपनी तकनीक का डेमो जारी करने की Ai2 की नई रणनीति का हिस्सा।

“प्रशिक्षण के बाद वास्तव में महत्वपूर्ण है,” कहा हन्ना हाजीशिरज़ीएआई2 के प्राकृतिक भाषा प्रसंस्करण के वरिष्ठ निदेशक ने इस सप्ताह एक मीडिया ब्रीफिंग में एआई भाषा मॉडल को उपयोगी बनाने में प्रशिक्षण के बाद की महत्वपूर्ण भूमिका का वर्णन किया।

यह भी एक चुनौतीपूर्ण प्रक्रिया है, उन्होंने समझाया, यह देखते हुए कि प्रशिक्षण के बाद एआई विशिष्ट क्षमताएं देने से मॉडल उन सामान्य क्षमताओं को भूल जाते हैं जो उन्होंने पूर्व-प्रशिक्षण प्रक्रिया के दौरान प्राप्त की थीं। और अब तक, प्रशिक्षण के बाद का चरण उद्योग में एक बारीकी से संरक्षित रहस्य रहा है, जिससे बंद मॉडलों को लाभ मिलता है।

तुलु 3 रिलीज के साथ, विचार व्यापक समुदाय को स्क्रैच से पूरी तरह से पूर्व-प्रशिक्षण मॉडल के लिए आवश्यक बड़े कंप्यूटिंग संसाधनों के बिना उच्च गुणवत्ता वाले पोस्ट-प्रशिक्षित मॉडल को समझने और बनाने में सक्षम बनाना है।

“प्रशिक्षण के बाद इस तरह का जादुई ब्लैक-बॉक्स चरण होता है जो मॉडलों को सामान्य क्षमता खोए बिना कुछ कार्यों में वास्तव में अच्छा बनाता है,” ने कहा। सोफी लेब्रेक्टAi2 मुख्य परिचालन अधिकारी। उन्होंने कहा कि तुलु 3 रिलीज लोगों को उच्च-गुणवत्ता, कार्य-विशिष्ट मॉडल बनाने के लिए “एक बड़ा गेम चेंजर” होने का वादा करती है।

पिछले तुलु मॉडल से मुख्य अंतरों में डेटा क्यूरेशन में प्रगति, एक अधिक कठोर मूल्यांकन ढांचा, और मल्टी-स्टेज प्रशिक्षण प्रक्रिया सहित एल्गोरिदम और बुनियादी ढांचे में सुधार शामिल हैं।

“ऐसी कई चीजें हैं जहां यह लगभग आश्चर्यजनक है कि यदि आप इसे सही डेटा देते हैं तो यह कितना आसान है,” उन्होंने कहा नाथन लैंबर्टएआई2 मशीन लर्निंग वैज्ञानिक, एआई2 द्वारा तुलु 3 मॉडल के साथ लागू की गई प्रगति का वर्णन कर रहे हैं।

Ai2 की स्थापना 2014 में दिवंगत Microsoft सह-संस्थापक पॉल एलन द्वारा की गई थी। इसका नेतृत्व पिछले वर्ष से किया जा रहा है अली फरहादीजिन्होंने पहले सीईओ के रूप में Ai2 स्पिनआउट Xnor.ai की स्थापना और नेतृत्व किया था, और 2020 में इसे Apple को बेच दिया अनुमानित $200 मिलियन का सौदा, जो संस्थान की अब तक की सबसे बड़ी व्यावसायिक सफलताओं में से एक है।

इस साल की शुरुआत में, Ai2 रिलीज़ हुई नया मल्टीमॉडल कृत्रिम बुद्धिमत्ता मॉडलडब किया गया मुँहजो दृश्य डेटा के साथ नए तरीकों से काम करता है। ऐ2 अपना ओपन लैंग्वेज मॉडल जारी कियाया एल्मपिछले साल फरवरी में, जेनेरिक एआई मॉडल के उदय में अधिक पारदर्शिता लाने के एक बड़े प्रयास का हिस्सा।

Ai2 का वाशिंगटन विश्वविद्यालय के एलन स्कूल ऑफ कंप्यूटर साइंस एंड इंजीनियरिंग से संबंध है, जहां हाजीशिरज़ी जैसे Ai2 अनुसंधान नेताओं के पास भी संकाय पद हैं।

तुलु 3 पोस्ट-प्रशिक्षित मॉडल और संबंधित संसाधनों के लिंक देखें यहाँ.

Source link

एआई2 का नया तुलु 3 मॉडल ओपन-सोर्स एआई पोस्ट-ट्रेनिंग के लिए सफलता में तकनीकी दिग्गजों को टक्कर देता है

कोई जवाब दें

नवीनतम लेखहरू

संयुक्त राष्ट्र के 35 देशों के परमाणु निगरानी बोर्ड ने ईरान...

जेट्स में शामिल होने के बाद से डेवैंट एडम्स के उत्पादन...

मधुमेह हृदय रोग के उपचार के लिए नई आशा

‘गुरुवार की रात फ़ुटबॉल’ पर ब्राउन्स-स्टीलर्स के कुल योग पर बड़ा...

भारत और ऑस्ट्रेलिया के बीच बॉर्डर-गावस्कर ट्रॉफी 2024-25 के पहले टेस्ट...

एसईसी के अध्यक्ष गैरी जेन्सलर ट्रम्प के उद्घाटन दिवस पर इस्तीफा...

पोर्टलैंड राज्य के अध्ययन में जलवायु संकट की तुलना ‘मेगा-विशाल’ ज्वालामुखी...

सिएटल स्थित फ्रेज़ियर हेल्थकेयर पार्टनर्स ने 11वें फंड के लिए $2.3B...

कॉलेज फ़ुटबॉल प्लेऑफ़ रैंकिंग: तीसरी सीएफ़पी रैंकिंग से जोएल क्लैट की...

मैरीलैंड के गवर्नर ने $190K ट्रम्प-केंद्रित परामर्श अनुबंध का बचाव किया...

वैंकूवर पार्क बोर्ड को ख़त्म करने से प्रति वर्ष $7 मिलियन...

संयुक्त राष्ट्र निगरानी संस्था ने परमाणु कार्यक्रम गोपनीयता को लेकर ईरान...

पैनिक 2: एक शुरुआती मार्गदर्शिका

जूलियन एडेलमैन चर्चा करते हैं कि क्या वह संभावित वापसी में...

मैथ्यू मैककोनाघी ने बताया कि रोम-कॉम में उनकी भूमिकाओं ने हॉलीवुड...

श्रेणी

कोई जवाब दें जवाब कैंसिल करें

नवीनतम लेखहरू

श्रेणी

कोई जवाब दें