अपने नए सोरा वीडियो जनरेटर के “फीचर्ड” टैब पर, ओपनएआई असाधारण एआई वीडियो क्लिप का एक समूह हाइलाइट करता है। वहाँ एक पांडा सबवे पर सवारी कर रहा है, एक एलियन सिगरेट पी रहा है, एक कागज़ की नाव तूफानी समुद्र में चल रही है, और एक सुनहरी मूर्ति आपकी ओर देख रही है।
वीडियो एक अद्भुत नई तकनीक के आश्चर्यजनक आउटपुट हैं, लेकिन कौन जानता है कि वे किस लिए हैं। आकर्षक और रचनात्मक लेकिन व्यावसायिक उत्पादन में शामिल करने के लिए बहुत कम गुणवत्ता वाली, सोरा क्लिप सीमित अवस्था में मौजूद हैं। हां, उत्पाद कम से कम कुछ भौतिकी को समझता है, और एआई वीडियो वर्ष की तकनीकी सफलता हो सकता है। लेकिन अब तक के कई जेनेरिक एआई उत्पादों की तरह, यह पूरी तरह से स्पष्ट नहीं है कि हमें इसके साथ क्या करना चाहिए।
एआई वीडियो में निश्चित रूप से सुधार होगा, लेकिन सोरा और उसके समकक्ष कम से कम अभी के लिए अच्छे कारक पर अधिक और उपयोगिता पर कम प्रतीत होते हैं। समस्या: कोई प्राकृतिक उपयोगकर्ता नहीं है. चैटजीपीटी के साथ, कोडर्स और छात्रों ने तत्काल मूल्य देखा, और एआई टेक्स्ट जेनरेशन का तब से अधिक उपयोग के मामलों में विस्तार हुआ है। हालाँकि, Dall-E जैसे छवि जनरेटर उसी तरह से आगे नहीं बढ़ पाए हैं, अपने समृद्ध मीडिया प्रारूप के प्राकृतिक अनुप्रयोगों को खोजने के लिए संघर्ष कर रहे हैं। इसी तरह, सोरा फीचर फिल्मों या यहां तक कि विज्ञापनों के लिए क्लिप तैयार करने के लिए पर्याप्त अच्छा नहीं है, और नियमित लोगों के लिए उपयोगी होने के लिए थोड़ा बहुत तीव्र है। इसलिए इसके उपयोग का मामला अस्पष्ट बना हुआ है।
में एक ब्लॉग पोस्ट की घोषणा इस सप्ताह सोरा की सामान्य रिलीज़, ओपनएआई ने कहा कि उसे उम्मीद है कि यह “हर जगह लोगों को रचनात्मकता के नए रूपों का पता लगाने, अपनी कहानियाँ बताने और वीडियो स्टोरीटेलिंग के साथ जो संभव है उसकी सीमाओं को आगे बढ़ाने में सक्षम बनाएगा।” लेकिन एक ऐसे व्यक्ति के रूप में जिसने अभी-अभी वीडियो संपादित करना सीखा है, मैं प्रमाणित कर सकता हूं कि वीडियो के साथ कुछ भी करना कठिन है। यहां तक कि हर किसी के हाथों में सोरा की अविश्वसनीय शक्ति के साथ, इसे फिर से काम करने की कल्पना करना कठिन है इंटरनेट का 90-9-1 नियमजहां 90% लोग उपभोग करते हैं, 9% वितरण करते हैं, और 1% सृजन करते हैं।
सोरा के “हालिया” टैब को देखने से कुछ दिलचस्पी तो दिखती है, लेकिन इस बात पर असमंजस है कि सेवा के साथ क्या किया जाए। एक उपयोगकर्ता ने ड्राइवर की सीट पर एक कुत्ते को बिठाया, दूसरे ने नाविक टोपी में एक बिल्ली को बिठाया, दूसरे ने रात में कब्रिस्तान में टहलते हुए एक घोड़े को दिखाया। बहुत सारे जानवर हैं. और बहुत सारी महिलाएँ, कुछ ने खौफनाक विवरण के साथ संकेत दिया। ऐसा प्रतीत होता है कि वीडियो उपयोगकर्ताओं को दूसरी दुनिया में भागने, या “सीमाओं को आगे बढ़ाने” की अनुमति देते हैं, जैसा कि OpenAI सुझाव देता है। लेकिन एक बार जब आप कुछ बार संकेत देते हैं, तो वापस आने और भुगतान करने का अनिवार्य कारण ढूंढना कठिन हो जाता है। आपको कार चलाते हुए कितने पिल्लों को देखने की आवश्यकता है?
निस्संदेह, सोरा को कुछ मूल्यवान अनुप्रयोग मिलेंगे। इससे फिल्म निर्देशकों को दृश्यों की शूटिंग से पहले उनकी साजिश रचने की अनुमति मिल जाएगी। यह फैशन ब्रांडों को मॉडलों को रनवे पर अपना काम करने से पहले उसे पहनते हुए देखने में सक्षम बनाएगा। और यह ब्रांड प्रबंधकों को इंस्टाग्राम के लिए फंकी पोस्ट बनाने में मदद करेगा। हाँ, ये AI वीडियो संभवतः हमारे सोशल मीडिया फ़ीड को भर देंगे झींगा यीशु ने फेसबुक भर दिया है.
लेकिन सोरा ऐसे समय में भी पदार्पण कर रही है जब यह निर्धारित करना कि वास्तविक क्या है, पहले से कहीं अधिक कठिन है, और सेवा और उसके समकक्ष भ्रम बढ़ा देंगे। पिछले सप्ताह, मुझे यूनाइटेड हेल्थकेयर शूटिंग कहानी का अनुसरण करना लगभग किसी भी पिछली प्रमुख कहानी की तुलना में कठिन लगा। ऑनलाइन एक नकली सबस्टैक और ढेर सारी नकली जानकारी थी। लेकिन शूटर के फर्जी वीडियो सबसे ज्यादा हैरान करने वाले थे. कई उपयोगकर्ताओं ने निगरानी वीडियो से शूटर के नकली एआई वीडियो तैयार किए। और जबकि कुछ स्पष्ट रूप से कहा कि यह एआई थादूसरों ने वीडियो साझा किए जोर दिया नहीं थे. यह सब भावना में योगदान देता है वास्तविकता उदासीनताजहां सच और झूठ को बताना इतना कठिन है कि आप बस हार मान लेते हैं।
OpenAI के श्रेय के लिए, सोरा के सुरक्षा उपाय बहुत अच्छे हैं। सेवा मुझे लोगों की छवियों से वीडियो बनाने की अनुमति नहीं देती है, और जब मैंने ट्रम्प के नृत्य और मैकडॉनल्ड्स में यूएचसी शूटर की गिरफ्तारी के वीडियो बनाने की कोशिश की तो इसने मेरे संकेतों को अवरुद्ध कर दिया। ओपनएआई ने सोरा टीम के एक सदस्य को साक्षात्कार के लिए उपलब्ध कराने से इनकार कर दिया।
शायद वीडियो निर्माण पहलू पर इतना अधिक ध्यान केंद्रित करके मैं मुद्दा भूल रहा हूँ। सोरा अच्छे वीडियो बना सकता है, लेकिन उत्पाद का मूल आधार पाठ में दर्शाए गए से परे वास्तविक दुनिया की कृत्रिम बुद्धिमत्ता की समझ को बढ़ाना है। ओपनएआई ने अपनी घोषणा में लिखा, “सोरा एआई के लिए एक आधार के रूप में कार्य करता है जो वास्तविकता को समझता है और उसका अनुकरण करता है।” यह ऐसे मॉडल विकसित करने की दिशा में एक महत्वपूर्ण कदम है जो भौतिक दुनिया के साथ बातचीत कर सकते हैं।
वास्तविक दुनिया के साथ बातचीत का मतलब सोरा की बुद्धिमत्ता को रोबोटिक्स में लागू करना, या शायद उन मॉडलों की मदद करना हो सकता है जो उस ग्रह को समझते हैं जिसके बारे में वे संचार कर रहे हैं। यदि ऐसा होता है, तो यह वही हो सकता है जिसके लिए सोरा है।
यह लेख से है बड़ी प्रौद्योगिकीएलेक्स कांट्रोविट्ज़ का एक समाचार पत्र।