माइक्रोसॉफ्ट कई नए “ओपन” एआई मॉडल लॉन्च किए बुधवार को, जिसमें सबसे अधिक सक्षम है, कम से कम एक बेंचमार्क पर Openai के O3-Mini के साथ प्रतिस्पर्धी है।

सभी नए पेमिसली लाइसेंस प्राप्त मॉडल-PHI 4 मिनी रीज़निंग, PHI 4 रीजनिंग, और Phi 4 रीजनिंग प्लस-“रीजनिंग” मॉडल हैं, जिसका अर्थ है कि वे जटिल समस्याओं के लिए अधिक समय-तथ्य-जाँच समाधान खर्च करने में सक्षम हैं। वे Microsoft के PHI “स्मॉल मॉडल” परिवार का विस्तार करते हैं, जिसे कंपनी ने एक साल पहले लॉन्च किया था ताकि एआई डेवलपर्स बिल्डिंग ऐप्स को किनारे पर एक फाउंडेशन दिया जा सके।

PHI 4 मिनी तर्क को चीनी AI स्टार्टअप दीपसेक के R1 रीज़निंग मॉडल द्वारा उत्पन्न लगभग 1 मिलियन सिंथेटिक गणित की समस्याओं पर प्रशिक्षित किया गया था। आकार में लगभग 3.8 बिलियन पैरामीटर, PHI 4 मिनी रीज़निंग को शैक्षिक अनुप्रयोगों के लिए डिज़ाइन किया गया है, Microsoft कहते हैं, जैसे हल्के उपकरणों पर “एम्बेडेड ट्यूशन”।

पैरामीटर मोटे तौर पर एक मॉडल की समस्या-समाधान कौशल के अनुरूप हैं, और अधिक मापदंडों वाले मॉडल आमतौर पर कम मापदंडों वाले लोगों की तुलना में बेहतर प्रदर्शन करते हैं।

PHI 4 रीजनिंग, एक 14 बिलियन-पैरामीटर मॉडल, को “उच्च-गुणवत्ता” वेब डेटा के साथ-साथ Openai के पूर्वोक्त O3-Mini से “क्यूरेट किए गए प्रदर्शनों” का उपयोग करके प्रशिक्षित किया गया था। Microsoft के अनुसार, यह गणित, विज्ञान और कोडिंग अनुप्रयोगों के लिए सबसे अच्छा है।

PHI 4 रीजनिंग प्लस के लिए, यह Microsoft का पहले से जारी PHI-4 मॉडल है जो विशेष कार्यों पर बेहतर सटीकता प्राप्त करने के लिए एक तर्क मॉडल में अनुकूलित है। Microsoft का दावा है कि PHI 4 रीज़निंग प्लस R1 के प्रदर्शन स्तरों के पास पहुंचता है, जो काफी अधिक मापदंडों (671 बिलियन) के साथ एक मॉडल है। कंपनी के आंतरिक बेंचमार्किंग में एक गणित कौशल परीक्षण ओमनीमथ पर PHI 4 रीज़निंग प्लस ओ 3-मिनी है।

PHI 4 मिनी रीज़निंग, PHI 4 रीज़निंग, और PHI 4 रीजनिंग प्लस उपलब्ध हैं ऐ देव प्लेटफॉर्म गले लगना चेहरा विस्तृत तकनीकी रिपोर्टों के साथ।

TechCrunch घटना

बर्कले, सीए
|
5 जून


अभी बुक करें

“आसवन, सुदृढीकरण सीखने और उच्च गुणवत्ता वाले डेटा का उपयोग करना, ये [new] मॉडल आकार और प्रदर्शन को संतुलित करते हैं, ”एक में Microsoft लिखा ब्लॉग भेजा। “वे कम-विलंबता वातावरण के लिए काफी छोटे हैं, फिर भी मजबूत तर्क क्षमताओं को बनाए रखते हैं जो बहुत बड़े मॉडल को प्रतिद्वंद्वी करते हैं। यह मिश्रण भी संसाधन-सीमित उपकरणों को जटिल तर्क कार्यों को कुशलता से करने की अनुमति देता है।”



Source link