आपके पास एक कंपनी है तिल माया, शक्तियों के आधार मॉडल को जारी किया है प्रभावशाली यथार्थवादी आवाज सहायक

मॉडल, जो आकार में 1 बिलियन पैरामीटर है (“पैरामीटर” मॉडल के व्यक्तिगत घटकों का उल्लेख करते हुए), अपाचे 2.0 लाइसेंस के तहत है, जिसका अर्थ है कि इसका उपयोग कुछ प्रतिबंधों के साथ व्यावसायिक रूप से किया जा सकता है। CSM-1B कहा जाता है, मॉडल पाठ और ऑडियो इनपुट से “RVQ ऑडियो कोड” उत्पन्न करता है, इसके अनुसार एआई देव प्लेटफॉर्म गले लगने वाले चेहरे पर तिल का विवरण

RVQ “अवशिष्ट वेक्टर परिमाणीकरण” को संदर्भित करता है, कोड को असतत टोकन में ऑडियो को एन्कोडिंग करने के लिए एक तकनीक। RVQ का उपयोग किया जाता है हाल के कई एआई ऑडियो प्रौद्योगिकियों मेंGoogle के साउंडस्ट्रीम और मेटा के एनकोडेक सहित।

CSM-1B से एक मॉडल का उपयोग करता है मेटा का लामा परिवार इसके बैकबोन के रूप में एक ऑडियो “डिकोडर” घटक के साथ जोड़ा गया। सीएसएम पॉवर्स माया का एक अच्छा-ट्यून वेरिएंट, तिल का कहना है।

सीएसएम -1 बी के तिल लिखते हैं, “यहां ओपन-सोर्स्ड मॉडल एक बेस जेनरेशन मॉडल है।” गले का चेहरा और गिरब रिपॉजिटरी। “यह विभिन्न प्रकार की आवाज़ों का उत्पादन करने में सक्षम है, लेकिन यह किसी विशिष्ट आवाज पर ठीक नहीं है […] प्रशिक्षण डेटा में डेटा संदूषण के कारण मॉडल में गैर-अंग्रेजी भाषाओं के लिए कुछ क्षमता है, लेकिन यह अच्छी तरह से अच्छा नहीं करेगा। ”

यह स्पष्ट नहीं है कि CSM-1B को प्रशिक्षित करने के लिए किस डेटा का उपयोग किया जाता है। कंपनी ने नहीं कहा।

यह ध्यान देने योग्य है कि मॉडल के पास बोलने के लिए कोई वास्तविक सुरक्षा उपाय नहीं हैं। तिल के पास एक सम्मान प्रणाली है और केवल डेवलपर्स और उपयोगकर्ताओं से आग्रह करता है कि वे अपनी सहमति के बिना किसी व्यक्ति की आवाज की नकल करने के लिए मॉडल का उपयोग न करें, नकली समाचार जैसी भ्रामक सामग्री बनाएं, या “हानिकारक” या “दुर्भावनापूर्ण” गतिविधियों में संलग्न हों।

मैंने कोशिश की डेमो चेहरे को गले लगाने पर, और मेरी आवाज को क्लोन करने में एक मिनट से भी कम समय लगा। वहां से, चुनाव और रूसी प्रचार जैसे विवादास्पद विषयों सहित, मेरे दिल की इच्छा के लिए भाषण उत्पन्न करना आसान था।

उपभोक्ता रिपोर्टों ने हाल ही में चेतावनी दी है कि बाजार पर कई लोकप्रिय एआई-संचालित वॉयस क्लोनिंग टूल “सार्थक” सुरक्षा उपाय नहीं हैं धोखाधड़ी या दुरुपयोग को रोकने के लिए।

ओकुलस के सह-निर्माता ब्रेंडन इरिब द्वारा सह-स्थापना की गई त्सेम, फरवरी के अंत में अपनी सहायक तकनीक के लिए वायरल हो गई, जो कि अलौकिक घाटी क्षेत्र को साफ करने के करीब है। माया और तिल के अन्य सहायक, माइल्स, सांस लेते हैं और असंतुष्टता के साथ बोलते हैं, और बोलते समय बाधित हो सकते हैं, ओपनई की आवाज मोड की तरह

तिल ने आंद्रेसेन होरोविट्ज़, स्पार्क कैपिटल और मैट्रिक्स पार्टनर्स से पूंजी की एक अज्ञात राशि जुटाई है। वॉयस असिस्टेंट टेक का निर्माण करने के अलावा, कंपनी का कहना है कि यह एआई ग्लास को “पूरे दिन पहने जाने के लिए डिज़ाइन किया गया” प्रोटोटाइप कर रहा है जो इसके कस्टम मॉडल से लैस होगा।



Source link

कोई जवाब दें

कृपया अपनी टिप्पणी दर्ज करें!
कृपया अपना नाम यहाँ दर्ज करें