माइक्रोसॉफ्ट ने शुक्रवार को अपना Phi-4 कृत्रिम बुद्धिमत्ता (AI) मॉडल जारी किया। कंपनी का नवीनतम लघु भाषा मॉडल (एसएलएम) उसके मूलभूत मॉडलों के ओपन-सोर्स फी परिवार में शामिल हो गया है। AI मॉडल Phi-3 की रिलीज़ के आठ महीने बाद और AI मॉडल की Phi-3.5 श्रृंखला की शुरुआत के चार महीने बाद आता है। तकनीकी दिग्गज का दावा है कि एसएलएम गणित जैसे क्षेत्रों में जटिल तर्क-आधारित प्रश्नों को हल करने में अधिक सक्षम है। इसके अतिरिक्त, इसे पारंपरिक भाषा प्रसंस्करण में उत्कृष्टता प्राप्त करने के लिए भी कहा जाता है।
माइक्रोसॉफ्ट का Phi-4 AI मॉडल हगिंग फेस के माध्यम से उपलब्ध होगा
अब तक, प्रत्येक Phi श्रृंखला को एक मिनी संस्करण के साथ लॉन्च किया गया है, हालाँकि, Phi-4 मॉडल के साथ कोई मिनी मॉडल नहीं आया है। माइक्रोसॉफ्ट, एक में ब्लॉग भेजाइस बात पर प्रकाश डाला गया कि Phi-4 वर्तमान में Microsoft रिसर्च लाइसेंस एग्रीमेंट (MSRLA) के तहत Azure AI फाउंड्री पर उपलब्ध है। कंपनी की योजना इसे अगले हफ्ते हगिंग फेस पर भी उपलब्ध कराने की है।
कंपनी ने अपने आंतरिक परीक्षण से बेंचमार्क स्कोर भी साझा किए। इनके आधार पर, नया AI मॉडल पुरानी पीढ़ी के मॉडल की क्षमताओं को महत्वपूर्ण रूप से उन्नत करता है। टेक दिग्गज ने दावा किया कि गणित प्रतियोगिता समस्याओं के बेंचमार्क पर Phi-4, एक बहुत बड़े मॉडल, जेमिनी प्रो 1.5 से बेहतर प्रदर्शन करता है। इसने एक तकनीकी पेपर में एक विस्तृत बेंचमार्क प्रदर्शन भी जारी किया प्रकाशित ऑनलाइन जर्नल arXiv में।
सुरक्षा पर, माइक्रोसॉफ्ट ने कहा कि एज़्योर एआई फाउंड्री संगठनों को पारंपरिक मशीन लर्निंग और जेनरेटिव एआई अनुप्रयोगों के विकास जीवनचक्र में एआई जोखिमों को मापने, कम करने और प्रबंधित करने में मदद करने के लिए क्षमताओं के एक सेट के साथ आती है। इसके अतिरिक्त, एंटरप्राइज़ उपयोगकर्ता सामग्री फ़िल्टर के रूप में Azure AI सामग्री सुरक्षा सुविधाओं जैसे प्रॉम्प्ट शील्ड, ग्राउंडेडनेस डिटेक्शन और अन्य का उपयोग कर सकते हैं।
डेवलपर्स एकल एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) के माध्यम से इन सुरक्षा क्षमताओं को अपने एप्लिकेशन में भी जोड़ सकते हैं। प्लेटफ़ॉर्म गुणवत्ता और सुरक्षा, प्रतिकूल त्वरित हमलों और डेटा अखंडता के लिए अनुप्रयोगों की निगरानी कर सकता है और डेवलपर्स को वास्तविक समय अलर्ट प्रदान कर सकता है। यह उन Phi उपयोगकर्ताओं के लिए उपलब्ध होगा जो इसे Azure के माध्यम से एक्सेस करते हैं।
विशेष रूप से, छोटे भाषा मॉडल को अक्सर सिंथेटिक डेटा पर तैनाती के बाद प्रशिक्षित किया जा रहा है, जिससे उन्हें जल्दी से अधिक ज्ञान और उच्च दक्षता प्राप्त करने की अनुमति मिलती है। हालाँकि, प्रशिक्षण के बाद के परिणाम वास्तविक दुनिया के उपयोग के मामलों में हमेशा सुसंगत नहीं होते हैं।