चीनी कंपनियां एआई मॉडल जारी करना जारी रखती हैं जो ओपनएआई और अन्य यूएस-आधारित एआई कंपनियों द्वारा विकसित सिस्टम की क्षमताओं को टक्कर देती हैं।
इस सप्ताह, अल्पमहिष्ठएक अलीबाबा- और Tencent समर्थित स्टार्टअप है उठाया उद्यम पूंजी लगभग $850 मिलियन है और इसका मूल्य $2.5 बिलियन से अधिक है, शुरू हुआ तीन नए मॉडल: मिनीमैक्स-टेक्स्ट-01, मिनीमैक्स-वीएल-01, और टी2ए-01-एचडी। MiniMax-Text-01 एक टेक्स्ट-ओनली मॉडल है, जबकि MiniMax-VL-01 इमेज और टेक्स्ट दोनों को समझ सकता है। इस बीच, T2A-01-HD, ऑडियो उत्पन्न करता है – विशेष रूप से भाषण।
MiniMax का दावा है कि MiniMax-Text-01, जिसका आकार 456 बिलियन पैरामीटर है, Google के हाल ही में अनावरण किए गए मॉडल से बेहतर प्रदर्शन करता है जेमिनी 2.0 फ़्लैश एमएमएलयू और सिंपलक्यूए जैसे बेंचमार्क पर, जो गणित की समस्याओं और तथ्य-आधारित प्रश्नों का उत्तर देने के लिए एक मॉडल की क्षमता को मापते हैं। पैरामीटर मोटे तौर पर एक मॉडल की समस्या-समाधान कौशल के अनुरूप होते हैं, और अधिक पैरामीटर वाले मॉडल आमतौर पर कम पैरामीटर वाले मॉडल से बेहतर प्रदर्शन करते हैं।
जहां तक MiniMax-VL-01 का सवाल है, MiniMax का कहना है कि यह एंथ्रोपिक को टक्कर देता है क्लाउड 3.5 सॉनेट ऐसे मूल्यांकनों पर जिनके लिए मल्टीमॉडल समझ की आवश्यकता होती है, जैसे कि चार्टक्यूए, जो मॉडल को ग्राफ़ और आरेख-संबंधित प्रश्नों का उत्तर देने का काम करता है (उदाहरण के लिए, “इस ग्राफ़ में नारंगी रेखा का चरम मूल्य क्या है?”)। माना, MiniMax-VL-01 इनमें से कई परीक्षणों में जेमिनी 2.0 फ़्लैश से बेहतर नहीं है। ओपनएआई GPT-4o और इंटर्नवीएल2.5 नामक एक खुले मॉडल ने भी इसे कई में मात दी।
ध्यान दें, MiniMax-Text-01 में एक अत्यंत बड़ी संदर्भ विंडो है। एक मॉडल का संदर्भ, या संदर्भ विंडो, इनपुट (उदाहरण के लिए, टेक्स्ट) को संदर्भित करता है जिसे एक मॉडल आउटपुट (अतिरिक्त टेक्स्ट) उत्पन्न करने से पहले मानता है। 4 मिलियन टोकन की संदर्भ विंडो के साथ, MiniMax-Text-01 एक बार में लगभग 3 मिलियन शब्दों का विश्लेषण कर सकता है – या “वॉर एंड पीस” की केवल पांच प्रतियों का।
संदर्भ के लिए (कोई व्यंग्यात्मक इरादा नहीं), MiniMax-Text-01 की संदर्भ विंडो GPT-4o और Llama 3.1 के आकार से लगभग 31 गुना बड़ी है।
इस सप्ताह जारी मिनीमैक्स का आखिरी मॉडल, टी2ए-01-एचडी, भाषण के लिए अनुकूलित एक ऑडियो जनरेटर है। T2A-01-HD अंग्रेजी और चीनी सहित लगभग 17 विभिन्न भाषाओं में समायोज्य ताल, टोन और टेनर के साथ एक सिंथेटिक आवाज उत्पन्न कर सकता है, और केवल 10 सेकंड की ऑडियो रिकॉर्डिंग से एक आवाज को क्लोन कर सकता है।
MiniMax ने T2A-01-HD की अन्य ऑडियो-जनरेटिंग मॉडल से तुलना करते हुए बेंचमार्क परिणाम प्रकाशित नहीं किए। लेकिन इस रिपोर्टर के कान में, T2A-01-HD का आउटपुट ऑडियो मॉडल के बराबर लगता है मेटा और स्टार्टअप जैसे PlayAI.
T2A-01-HD के अपवाद के साथ, जो विशेष रूप से MiniMax के API और Hailuo AI प्लेटफ़ॉर्म के माध्यम से उपलब्ध है, MiniMax के नए मॉडल GitHub और AI डेव प्लेटफ़ॉर्म हगिंग फेस से डाउनलोड किए जा सकते हैं।
हालाँकि, सिर्फ इसलिए कि मॉडल “खुले तौर पर” उपलब्ध हैं, इसका मतलब यह नहीं है कि वे कुछ पहलुओं में बंद नहीं हैं। मिनीमैक्स-टेक्स्ट-01 और मिनीमैक्स-वीएल-01 वास्तव में खुला स्रोत नहीं हैं इस अर्थ में कि मिनीमैक्स ने उन्हें स्क्रैच से फिर से बनाने के लिए आवश्यक घटकों (उदाहरण के लिए, प्रशिक्षण डेटा) को जारी नहीं किया है। इसके अलावा, वे MiniMax के प्रतिबंधात्मक लाइसेंस के अंतर्गत हैं, जो डेवलपर्स को प्रतिद्वंद्वी AI मॉडल को बेहतर बनाने के लिए मॉडलों का उपयोग करने से रोकता है और इसके लिए आवश्यक है कि 100 मिलियन से अधिक मासिक सक्रिय उपयोगकर्ताओं वाले प्लेटफ़ॉर्म MiniMax से एक विशेष लाइसेंस का अनुरोध करें।
MiniMax की स्थापना 2021 में चीन की सबसे बड़ी AI फर्मों में से एक, SenseTime के पूर्व कर्मचारियों द्वारा की गई थी। कंपनी की परियोजनाओं में टॉकी जैसे ऐप शामिल हैं, जो एक एआई-संचालित रोल-प्लेइंग प्लेटफॉर्म है चरित्र ए.आईऔर टेक्स्ट-टू-वीडियो मॉडल जिन्हें MiniMax ने Hailuo में जारी किया है।
मिनीमैक्स के कुछ उत्पाद मामूली विवाद का विषय बन गए हैं।
टॉकी, जिसे दिसंबर में अनिर्दिष्ट “तकनीकी” कारणों से ऐप्पल के ऐप स्टोर से हटा दिया गया था, इसमें डोनाल्ड ट्रम्प, टेलर स्विफ्ट, एलोन मस्क और लेब्रोन जेम्स सहित सार्वजनिक हस्तियों के एआई अवतार शामिल हैं, जिनमें से किसी ने भी इसमें शामिल होने के लिए सहमति नहीं दी है। ऐप.
दिसंबर में, ब्रॉडकास्ट पत्रिका सूचना दी मिनीमैक्स के वीडियो जनरेटर ब्रिटिश टेलीविजन चैनलों के लोगो को पुन: पेश कर सकते हैं, जिससे पता चलता है कि मिनीमैक्स के मॉडल को उन चैनलों की सामग्री पर प्रशिक्षित किया गया था। और मिनीमैक्स कथित तौर पर है मुकदमा किया जा रहा है iQiyi द्वारा, एक चीनी वीडियो स्ट्रीमिंग सेवा, जो मिनीमैक्स पर अवैध रूप से iQiyi की कॉपीराइट रिकॉर्डिंग पर प्रशिक्षित होने का आरोप लगाती है।
मिनीमैक्स के नए मॉडल निवर्तमान बिडेन प्रशासन के कुछ दिनों बाद आए हैं प्रस्तावित चीनी उद्यमों के लिए एआई प्रौद्योगिकियों पर कठोर निर्यात नियम और प्रतिबंध। चीन में कंपनियों को पहले से ही उन्नत एआई चिप्स खरीदने से रोका गया था, लेकिन अगर नए नियम लिखित रूप में लागू होते हैं, तो कंपनियों को परिष्कृत एआई सिस्टम को बूटस्ट्रैप करने के लिए आवश्यक सेमीकंडक्टर तकनीक और मॉडल दोनों पर सख्त सीमाओं का सामना करना पड़ेगा।
बुधवार को, बिडेन प्रशासन की घोषणा की अतिरिक्त उपाय परिष्कृत चिप्स को चीन से बाहर रखने पर केंद्रित हैं। चिप फाउंड्री और पैकेजिंग कंपनियां जो कुछ चिप्स का निर्यात करना चाहती हैं, उन्हें व्यापक लाइसेंस आवश्यकताओं के अधीन किया जाएगा, जब तक कि वे अपने उत्पादों को चीनी ग्राहकों तक पहुंचने से रोकने के लिए अधिक जांच और उचित परिश्रम न करें।