Elevenlabsफील्ड एआई ऑडियो में काम करने वाले अधिक लोकप्रिय स्टार्टअप्स में से एक, ने गुरुवार को कहा कि उसने $ 180 मिलियन का एक सीरीज़ सी राउंड जुटाया है, जो कंपनी को 3.3 बिलियन डॉलर के पोस्ट-मनी में मानता है। A16Z और IConiq विकास सह-अग्रणी निवेश हैं।

धन उगाहने की अफवाहें थीं सबसे पहले TechCrunch द्वारा रिपोर्ट किया गया। अंतिम संख्या कुछ की पुष्टि करती है, लेकिन हमारे द्वारा पहले बताई गई सभी विवरण नहीं (विशेष रूप से, दौर का समग्र आकार हमने सुना था, वैल्यूएशन और लीड निवेशक समान हैं)।

फंडिंग का उपयोग Elevenlabs के ऑडियो टूल और व्यावसायिक विकास के लिए जारी रखने के लिए किया जाएगा।

बचपन के दोस्त पियोट्र डबकोव्स्की के साथ कंपनी की सह-स्थापना करने वाले सीईओ मटनी स्टैनिसेवस्की ने एक साक्षात्कार में कहा कि स्टार्टअप ऑडियो एआई मॉडल के निर्माण पर अपने शोध पर ध्यान केंद्रित कर रहा है जो अधिक अभिव्यंजक हैं और अधिक नियंत्रण है। Staniszewski ने कहा कि कंपनी “ओमनी-मॉडल” पर भी ध्यान केंद्रित कर रही है: मल्टीमॉडल इंटरैक्शन के लिए अपने ऑडियो मॉडल के साथ पाठ-आधारित मॉडल का संयोजन।

Elevenlabs में निवेशक ब्याज का एक उन्माद रहा है कई महीने वापस जा रहे हैंदो महत्वपूर्ण धाराओं की पीठ पर। सबसे पहले, जनरेटिव एआई के आसपास प्रचार की एक बड़ी लहर रही है जो इसके मद्देनजर बहुत सारी कंपनियों को पकड़ रही है। दूसरा, सिंथेटिक वॉयस तकनीक प्रदान करने वालों में एक प्रमुख खिलाड़ी के रूप में इलेवनबैब्स उभरे हैं। मीडिया और गेमिंग जैसे वर्टिकल में दर्जनों प्रमुख प्रकाशक और सामग्री रचनाकार, साथ ही कई अन्य तकनीकी स्टार्टअप्स, सभी अपनी आवाज और ऑडियो सुविधाओं को शक्ति देने के लिए इलेवनलैब्स तकनीक का उपयोग कर रहे हैं।

अप्रत्याशित रूप से, यह बहुत प्रमुख नामों के साथ एक बहुत भीड़ भरे फंडिंग दौर में अनुवाद किया गया है।

इस श्रृंखला के नए निवेशकों में NEA, वर्ल्ड इनोवेशन लैब (WIL), VALOR, एंडेवर कैटालिस्ट फंड और अबू धाबी इन्वेस्टमेंट फर्म Lunate शामिल हैं। पिछले निवेशकों में भाग लेने वाले सिकोइया कैपिटल, सेल्सफोर्स वेंचर्स, स्मैश कैपिटल, एसवी एंजेल, एनएफडीजी और ब्रॉडलाइट कैपिटल शामिल हैं।

इनमें से, Elevenlabs भी कई नए रणनीतिक बैकर्स को उठा रहा है – अर्थात्, अपनी तकनीक का उपयोग करने वाली कंपनियां जो अब इसमें निवेश कर रही हैं, भी। इनमें ड्यूश टेलीकॉम, एलजी टेक्नोलॉजी वेंचर्स, हबस्पॉट वेंचर्स, एनटीटी डोकोमो वेंचर्स और रिंगसेंट्रल वेंचर्स शामिल हैं।

ICONIQ भागीदार सेठ पियरेपोंट A16Z से मौजूदा बोर्ड के सदस्यों जेनिफर ली और कंपनी के सह-संस्थापकों के साथ कंपनी के बोर्ड में शामिल होंगे।

IConiq जनरेटिव AI स्टार्टअप्स के आसपास अपनी गतिविधियों को बढ़ा रहा है। लिखित आउटपुट में टैपिंग, फर्म भी लेखक में $ 200 मिलियन के दौर का सह-नेतृत्व किया गया गत नवंबर।

“हमने हमेशा महसूस किया है कि ऑडियो एक बहुत महत्वपूर्ण तौर -तरीक है, और हमने सोचा कि इस श्रेणी में एक बहुत बड़ी कंपनी होगी,” पियरेपॉन्ट ने TechCrunch को बताया। “हमने इसके लॉन्च से एलेवनलैब्स का अवलोकन किया है, और हम प्रौद्योगिकी की गुणवत्ता से प्रभावित थे, यह कितनी जल्दी माइंडशेयर और गति के संदर्भ में चढ़ा, और संस्थापकों की डोमेन विशेषज्ञता की गहराई।”

पियरेपोंट ने कहा कि एक बोर्ड के सदस्य के रूप में, कंपनी के साथ बहुत सारी बातचीत ऑडियो के लिए नए उपयोग के मामले बनाने और इसके लिए सही बाजार खोजने के आसपास होगी।

ऐसे समय में जब स्टार्टअप अभी भी विकास के दौर को बंद करने के लिए चुनौतीपूर्ण लग रहे हैं, यह उल्लेखनीय है कि EleveNlabs ने अपनी श्रृंखला B को $ 80 मिलियन का दौर उठाया, जिसने इसे $ 1 बिलियन, मूल्य दिया, बस एक साल पहले। ElevenLabs ने आज तक कुल $ 281 मिलियन जुटाए हैं।

उत्पाद रोडमैप

अपने एआई मॉडल को बेहतर बनाने पर ध्यान केंद्रित करने के अलावा, कंपनी ने सीधे और अधिक उपभोक्ताओं तक पहुंचने की महत्वाकांक्षा के साथ अपने संवादी एआई बिल्डर को विकसित करने के लिए फंडिंग का उपयोग करने की योजना बनाई है।

सह-संस्थापक Piotr Dabkowski और Mati Staniszewski। छवि creidts: elevenlabs

पिछले साल, कंपनी ने शुरुआत की एक एआई संवादी एजेंट मंचऔर उस उत्पाद का एक प्रमुख हिस्सा एक भाषण-से-पाठ घटक विकसित कर रहा था। Staniszewski ने कहा कि कंपनी उस क्षेत्र में बहुत अधिक सुधार करना चाहती है।

“हम समझना चाहते हैं कि आपके द्वारा एक बातचीत में क्या कहा जा रहा है। हम केवल सामग्री उत्पन्न करने और समझने और भाषण को स्थानांतरित करने से दूर जाने के तरीकों पर काम कर रहे हैं, ”Staniszewski ने कहा। “बहुत से लोग कहते हैं कि भाषण-से-पाठ एक हल की गई समस्या है। लेकिन कई भाषाओं के लिए, यह बहुत बुरा है। हमें लगता है कि हम बेहतर स्पीच डिटेक्शन मॉडल बना सकते हैं क्योंकि हमारे पास इन-हाउस टीम हैं जो डेटा एनोटेट करने और हमें त्वरित प्रतिक्रिया देने के लिए हैं। ”

कंपनी टेलीफोनी जैसे विरासत संचार का समर्थन करके एआई-संचालित संवादात्मक एजेंटों को बनाने और विभिन्न प्रकार के ज्ञान स्रोतों को बेहतर ढंग से एकीकृत करके भी दोगुना करना चाहती है। यह आंशिक रूप से इस दौर में टेल्कोस के साथ साझेदारी कर रहा है।

इसका उपयोग अपने ग्राहकों द्वारा अपने स्वयं के अभिलेखागार में टैप करने के लिए भी किया जा रहा है। पिछले साल, Elevenlabs ने भागीदारी की एक संवादी बॉट को तैनात करने के लिए समय प्रकाशन उपयोगकर्ताओं के लिए वर्ष के समय के बारे में प्रश्न पूछने के लिए।

Staniszewski ने कहा कि कंपनी साइटों पर अधिक संवादात्मक AI एजेंटों की कल्पना करती है: समाचार साइटों पर, उदाहरण के लिए, उपयोगकर्ता कहानियों के बारे में सवाल पूछ सकेंगे या बॉट को उन्हें संक्षेप में प्रस्तुत करने के लिए कहेंगे।

सीईओ ने यह भी उल्लेख किया कि जबकि एआई-संचालित वॉयस बॉट्स की गुणवत्ता में सुधार हुआ है, विभिन्न तरीकों से बोलने या भावनाओं वाले मनुष्यों पर प्रतिक्रिया करते हुए प्राकृतिक ध्वनि की समस्या अभी तक हल नहीं हुई है।

“जिस तरह से मैं आपसे बात करता हूं वह प्रभावित करता है कि आप कैसे प्रतिक्रिया करते हैं या मुझे जवाब देते हैं। कभी -कभी, मैं उत्साहित हो जाऊंगा, या कभी -कभी, मैं शांत हो जाऊंगा, और कई बार, मैं आपको बाधित करूंगा। आप तदनुसार मुझे जवाब देंगे। वर्तमान-जीन एआई समाधान अच्छे होने की कगार पर हैं, लेकिन वे मनुष्यों के रूप में अच्छे नहीं हैं, ”स्टैनिसेवस्की ने कहा।

Iconiq के पियरेपोंट ने भी इस बात पर जोर दिया कि यदि एआई आपको अच्छी तरह से नहीं समझता है, जब आप बात कर रहे हैं, तो मशीन संचार टूट जाता है और उपयोगकर्ता तुरंत रुचि खो देते हैं।

ElevenLabs ने ज्यादातर B2B भागीदारी के माध्यम से अपनी पहुंच (और राजस्व फ़नल) बढ़ाया है। लेकिन यह भी एक सीधे अंग पर बाहर जा रहा है।

2024 में, स्टार्टअप ने अपना पहला विशुद्ध रूप से उपभोक्ता-सामना करने वाला उत्पाद, ElevenLabs रीडर, लॉन्च किया, एक ऐप जो लेख, पाठ और दस्तावेज़ पढ़ता है। बाद में, कंपनी ने क्षमता को जोड़ा जेनेरिक एआई वॉयस के साथ एक पॉडकास्ट बनाएं दस्तावेज़ों और वेब पेजों से – इसके विपरीत नहीं कि आप Google के नोटबुक के साथ क्या कर सकते हैं। Staniszewski ने कहा कि वह अधिक उपभोक्ता अनुभवों में विस्तार करना चाहता है।

यह वास्तव में पहले से ही ऐसा कर सकता है। TechCrunch ने देखा कि कंपनी अलेनलैब्स रीडर ऐप पर एक कार्यक्रम का परीक्षण कर रही है, जो उपयोगकर्ताओं को प्लेटफ़ॉर्म पर ऑडियोबुक प्रकाशित करने के लिए आमंत्रित करती है। कंपनी भी रचनाकारों को उपकरण देना चाहती है, जिसमें कई आवाज़ें भविष्य में एक ऑडियोबुक पढ़ती हैं, जबकि बेहतर स्थानीयकरण भी बनाते हैं।

Staniszewski ने कहा कि कंपनी उपयोगकर्ताओं और कंपनियों के लिए अपने स्वयं के ऐप सहित अपनी सामग्री को बेहतर ढंग से वितरित करने के तरीके का पता लगा रही है। क्या यह अपने ग्राहकों के साथ वास्तविक प्रत्यक्ष प्रतिस्पर्धा में लाता है, यह देखने के लिए कुछ होगा। (यही एक कारण रहा है कि कई बी 2 बी टेक कंपनियां प्रत्यक्ष-से-उपभोक्ता नाटकों से दूर रहना पसंद करती हैं।) विशेष रूप से, ऑडियो कंटेंट प्लेटफॉर्म के लिए इलेवनलैब्स पॉवर्स वॉयस टेक्नोलॉजी जैसे लाइटस्पीड-समर्थित पॉकेट एफएम और Google- समर्थित कुकू एफएम

ElevenLabs पहले से ही Perplexity, Rabbit R1, Chess.com, ESPN, LEX FRIDMAN PODCAST, THE ATLANTIC और SYNTHESIA जैसे उत्पादों और प्लेटफार्मों पर AI- जनित ऑडियो को शक्ति प्रदान करता है। कंपनी के लिए लक्ष्य अधिक स्थानों पर होना है और एक एंड-टू-एंड वार्तालाप स्टैक भी है ताकि यह अपने ग्राहकों के लिए अधिक अनुभव और अंतर्दृष्टि उत्पन्न कर सके।

सुरक्षा

सभी इलेवनबैब्स के चांदी के लाइनिंग बादलों के बिना नहीं हुए हैं: इसकी तकनीक को कुछ उल्लेखनीय गलत सूचना अभियानों में फंसाया गया है। थ्रेट इंटेलिजेंस कंपनी की एक हालिया रिपोर्ट में भविष्य में रिकॉर्ड किया गया है कि कंपनी के उत्पाद का उपयोग एक रूसी प्रचार संचालन में किया गया था। पिछले साल, किसी ने बनाने के लिए कंपनी के वॉयस प्लेटफॉर्म का इस्तेमाल किया जो बिडेन का एक ऑडियो डीपफेक। 2023 में, मदरबोर्ड बताया कि 4chan सदस्यों ने कथित तौर पर AI ऑडियो जनरेशन टूल का इस्तेमाल किया, जो कि जो रोजान, बेन शापिरो और एम्मा वाटसन की तरह आवाज करने के लिए आवाजें पैदा करने के लिए आवाजें पैदा कर रहे थे।

लेकिन कंपनी को जवाब देने की जल्दी है। आज, इसकी नीति “अनधिकृत, हानिकारक या भ्रामक प्रतिरूपण” पर प्रतिबंध है। इसके अलावा, यह ऐसी सामग्री को बाहर निकालने के लिए मशीन-एलईडी और मानव मॉडरेशन के मिश्रण का उपयोग करता है। हालांकि, जैसा कि कंपनी अपने उपकरणों के सेट को बढ़ाती है और अधिक प्रत्यक्ष उपभोक्ता टचपॉइंट होती है, यह दुर्भावनापूर्ण अभिनेताओं के लिए अधिक अवसरों के लिए दरवाजा खोलता है ताकि इसका दुरुपयोग करने के तरीकों की तलाश की जा सके।

“एआई ऑडियो काम के सबसे आगे के लोगों में से एक के रूप में, हम इसे सही सुरक्षा तंत्र का निर्माण करने के लिए अपनी जिम्मेदारी के रूप में मानते हैं क्योंकि हम प्रौद्योगिकी का निर्माण करते हैं। हम अक्सर तैनाती या वाणिज्यिक लाभ की गति पर सुरक्षा को प्राथमिकता देने के लिए विकल्प बनाएंगे, ”स्टैनिसेवस्की ने कहा।

Staniszewski ने कहा कि जबकि कंपनी C2PA का अनुसरण करती है, मेटाडेटा का उपयोग करके सामग्री को ट्रैक करने के लिए एक मानक, यह भी है एक सार्वजनिक उपकरण यह किसी को भी यह जांचने की अनुमति देता है कि क्या ऑडियो को ग्यारहबैब तकनीक के माध्यम से उत्पन्न किया गया था, जो कि डिजिटल हस्ताक्षर का उपयोग कर रहा है, जो कि पीढ़ी के दौरान ऑडियो में है। यह एक ऐसा ट्रैक भी हो सकता है जो समय के साथ विकसित होता रहता है क्योंकि दुरुपयोग के लिए दृष्टिकोण भी अधिक परिष्कृत हो जाते हैं।



Source link

कोई जवाब दें

कृपया अपनी टिप्पणी दर्ज करें!
कृपया अपना नाम यहाँ दर्ज करें