चीनी कंपनियां एआई मॉडल जारी करना जारी रखती हैं जो ओपनएआई और अन्य यूएस-आधारित एआई कंपनियों द्वारा विकसित सिस्टम की क्षमताओं को टक्कर देती हैं।

इस सप्ताह, अल्पमहिष्ठएक अलीबाबा- और Tencent समर्थित स्टार्टअप है उठाया उद्यम पूंजी लगभग $850 मिलियन है और इसका मूल्य $2.5 बिलियन से अधिक है, शुरू हुआ तीन नए मॉडल: मिनीमैक्स-टेक्स्ट-01, मिनीमैक्स-वीएल-01, और टी2ए-01-एचडी। MiniMax-Text-01 एक टेक्स्ट-ओनली मॉडल है, जबकि MiniMax-VL-01 इमेज और टेक्स्ट दोनों को समझ सकता है। इस बीच, T2A-01-HD, ऑडियो उत्पन्न करता है – विशेष रूप से भाषण।

MiniMax का दावा है कि MiniMax-Text-01, जिसका आकार 456 बिलियन पैरामीटर है, Google के हाल ही में अनावरण किए गए मॉडल से बेहतर प्रदर्शन करता है जेमिनी 2.0 फ़्लैश एमएमएलयू और सिंपलक्यूए जैसे बेंचमार्क पर, जो गणित की समस्याओं और तथ्य-आधारित प्रश्नों का उत्तर देने के लिए एक मॉडल की क्षमता को मापते हैं। पैरामीटर मोटे तौर पर एक मॉडल की समस्या-समाधान कौशल के अनुरूप होते हैं, और अधिक पैरामीटर वाले मॉडल आमतौर पर कम पैरामीटर वाले मॉडल से बेहतर प्रदर्शन करते हैं।

जहां तक ​​MiniMax-VL-01 का सवाल है, MiniMax का कहना है कि यह एंथ्रोपिक को टक्कर देता है क्लाउड 3.5 सॉनेट ऐसे मूल्यांकनों पर जिनके लिए मल्टीमॉडल समझ की आवश्यकता होती है, जैसे कि चार्टक्यूए, जो मॉडल को ग्राफ़ और आरेख-संबंधित प्रश्नों का उत्तर देने का काम करता है (उदाहरण के लिए, “इस ग्राफ़ में नारंगी रेखा का चरम मूल्य क्या है?”)। माना, MiniMax-VL-01 इनमें से कई परीक्षणों में जेमिनी 2.0 फ़्लैश से बेहतर नहीं है। ओपनएआई GPT-4o और इंटर्नवीएल2.5 नामक एक खुले मॉडल ने भी इसे कई में मात दी।

ध्यान दें, MiniMax-Text-01 में एक अत्यंत बड़ी संदर्भ विंडो है। एक मॉडल का संदर्भ, या संदर्भ विंडो, इनपुट (उदाहरण के लिए, टेक्स्ट) को संदर्भित करता है जिसे एक मॉडल आउटपुट (अतिरिक्त टेक्स्ट) उत्पन्न करने से पहले मानता है। 4 मिलियन टोकन की संदर्भ विंडो के साथ, MiniMax-Text-01 एक बार में लगभग 3 मिलियन शब्दों का विश्लेषण कर सकता है – या “वॉर एंड पीस” की केवल पांच प्रतियों का।

संदर्भ के लिए (कोई व्यंग्यात्मक इरादा नहीं), MiniMax-Text-01 की संदर्भ विंडो GPT-4o और Llama 3.1 के आकार से लगभग 31 गुना बड़ी है।

इस सप्ताह जारी मिनीमैक्स का आखिरी मॉडल, टी2ए-01-एचडी, भाषण के लिए अनुकूलित एक ऑडियो जनरेटर है। T2A-01-HD अंग्रेजी और चीनी सहित लगभग 17 विभिन्न भाषाओं में समायोज्य ताल, टोन और टेनर के साथ एक सिंथेटिक आवाज उत्पन्न कर सकता है, और केवल 10 सेकंड की ऑडियो रिकॉर्डिंग से एक आवाज को क्लोन कर सकता है।

MiniMax ने T2A-01-HD की अन्य ऑडियो-जनरेटिंग मॉडल से तुलना करते हुए बेंचमार्क परिणाम प्रकाशित नहीं किए। लेकिन इस रिपोर्टर के कान में, T2A-01-HD का आउटपुट ऑडियो मॉडल के बराबर लगता है मेटा और स्टार्टअप जैसे PlayAI.

T2A-01-HD के अपवाद के साथ, जो विशेष रूप से MiniMax के API और Hailuo AI प्लेटफ़ॉर्म के माध्यम से उपलब्ध है, MiniMax के नए मॉडल GitHub और AI डेव प्लेटफ़ॉर्म हगिंग फेस से डाउनलोड किए जा सकते हैं।

हालाँकि, सिर्फ इसलिए कि मॉडल “खुले तौर पर” उपलब्ध हैं, इसका मतलब यह नहीं है कि वे कुछ पहलुओं में बंद नहीं हैं। मिनीमैक्स-टेक्स्ट-01 और मिनीमैक्स-वीएल-01 वास्तव में खुला स्रोत नहीं हैं इस अर्थ में कि मिनीमैक्स ने उन्हें स्क्रैच से फिर से बनाने के लिए आवश्यक घटकों (उदाहरण के लिए, प्रशिक्षण डेटा) को जारी नहीं किया है। इसके अलावा, वे MiniMax के प्रतिबंधात्मक लाइसेंस के अंतर्गत हैं, जो डेवलपर्स को प्रतिद्वंद्वी AI मॉडल को बेहतर बनाने के लिए मॉडलों का उपयोग करने से रोकता है और इसके लिए आवश्यक है कि 100 मिलियन से अधिक मासिक सक्रिय उपयोगकर्ताओं वाले प्लेटफ़ॉर्म MiniMax से एक विशेष लाइसेंस का अनुरोध करें।

MiniMax की स्थापना 2021 में चीन की सबसे बड़ी AI फर्मों में से एक, SenseTime के पूर्व कर्मचारियों द्वारा की गई थी। कंपनी की परियोजनाओं में टॉकी जैसे ऐप शामिल हैं, जो एक एआई-संचालित रोल-प्लेइंग प्लेटफॉर्म है चरित्र ए.आईऔर टेक्स्ट-टू-वीडियो मॉडल जिन्हें MiniMax ने Hailuo में जारी किया है।

मिनीमैक्स के कुछ उत्पाद मामूली विवाद का विषय बन गए हैं।

टॉकी, जिसे दिसंबर में अनिर्दिष्ट “तकनीकी” कारणों से ऐप्पल के ऐप स्टोर से हटा दिया गया था, इसमें डोनाल्ड ट्रम्प, टेलर स्विफ्ट, एलोन मस्क और लेब्रोन जेम्स सहित सार्वजनिक हस्तियों के एआई अवतार शामिल हैं, जिनमें से किसी ने भी इसमें शामिल होने के लिए सहमति नहीं दी है। ऐप.

दिसंबर में, ब्रॉडकास्ट पत्रिका सूचना दी मिनीमैक्स के वीडियो जनरेटर ब्रिटिश टेलीविजन चैनलों के लोगो को पुन: पेश कर सकते हैं, जिससे पता चलता है कि मिनीमैक्स के मॉडल को उन चैनलों की सामग्री पर प्रशिक्षित किया गया था। और मिनीमैक्स कथित तौर पर है मुकदमा किया जा रहा है iQiyi द्वारा, एक चीनी वीडियो स्ट्रीमिंग सेवा, जो मिनीमैक्स पर अवैध रूप से iQiyi की कॉपीराइट रिकॉर्डिंग पर प्रशिक्षित होने का आरोप लगाती है।

मिनीमैक्स के नए मॉडल निवर्तमान बिडेन प्रशासन के कुछ दिनों बाद आए हैं प्रस्तावित चीनी उद्यमों के लिए एआई प्रौद्योगिकियों पर कठोर निर्यात नियम और प्रतिबंध। चीन में कंपनियों को पहले से ही उन्नत एआई चिप्स खरीदने से रोका गया था, लेकिन अगर नए नियम लिखित रूप में लागू होते हैं, तो कंपनियों को परिष्कृत एआई सिस्टम को बूटस्ट्रैप करने के लिए आवश्यक सेमीकंडक्टर तकनीक और मॉडल दोनों पर सख्त सीमाओं का सामना करना पड़ेगा।

बुधवार को, बिडेन प्रशासन की घोषणा की अतिरिक्त उपाय परिष्कृत चिप्स को चीन से बाहर रखने पर केंद्रित हैं। चिप फाउंड्री और पैकेजिंग कंपनियां जो कुछ चिप्स का निर्यात करना चाहती हैं, उन्हें व्यापक लाइसेंस आवश्यकताओं के अधीन किया जाएगा, जब तक कि वे अपने उत्पादों को चीनी ग्राहकों तक पहुंचने से रोकने के लिए अधिक जांच और उचित परिश्रम न करें।



Source link