NYU टंडन स्कूल ऑफ इंजीनियरिंग के एक अध्ययन के अनुसार, स्ट्रीमिंग प्रौद्योगिकी के लिए एक नया दृष्टिकोण काफी सुधार कर सकता है कि उपयोगकर्ता आभासी वास्तविकता और संवर्धित वास्तविकता वातावरण का अनुभव कैसे करते हैं।

अनुसंधान-1 अप्रैल, 2025 को 16 वें एसीएम मल्टीमीडिया सिस्टम सम्मेलन में एक पेपर में प्रस्तुत किया गया-दृश्य गुणवत्ता को बनाए रखते हुए संभावित रूप से 7-गुना तक बैंडविड्थ आवश्यकताओं को कम करने के लिए, संभावित रूप से इमर्सिव 3 डी वातावरण में दृश्य सामग्री की भविष्यवाणी करने के लिए एक विधि का वर्णन करता है।

प्रौद्योगिकी को एक चल रहे एनवाईयू टंडन नेशनल साइंस फाउंडेशन-वित्त पोषित परियोजना में लागू किया जा रहा है, ताकि डांस एजुकेशन के लिए पॉइंट क्लाउड वीडियो लाया जा सके, जिससे 3 डी डांस इंस्ट्रक्शन को कम बैंडविड्थ आवश्यकताओं के साथ मानक उपकरणों पर सुव्यवस्थित बनाया जा सके।

“स्ट्रीमिंग इमर्सिव सामग्री के साथ मौलिक चुनौती हमेशा बड़ी मात्रा में डेटा की आवश्यकता रही है,” एनवाईयू टंडन में इलेक्ट्रिकल एंड कंप्यूटर इंजीनियरिंग डिपार्टमेंट (ईसीई) में प्रोफेसर ने बताया कि एनवाईयू टंडन के सेंटर फॉर एडवांस्ड टेक्नोलॉजी इन दूरसंचार (सीएटीटी) और एनवाईयू वायरलेस दोनों में संकाय सदस्य – जो अनुसंधान दल का नेतृत्व करते हैं। “पारंपरिक वीडियो स्ट्रीमिंग एक फ्रेम के भीतर सब कुछ भेजती है। यह नया दृष्टिकोण अधिक है जैसे आपकी आंखें आपको एक कमरे के चारों ओर फॉलो करती हैं – यह केवल वही है जो आप वास्तव में देख रहे हैं।”

प्रौद्योगिकी इमर्सिव अनुभवों के लिए “फील्ड-ऑफ-व्यू (FOV)” चुनौती को संबोधित करती है। वर्तमान एआर/वीआर एप्लिकेशन उच्च बैंडविड्थ की मांग करते हैं-एक बिंदु क्लाउड वीडियो (जो अंतरिक्ष में डेटा बिंदुओं के संग्रह के रूप में 3 डी दृश्यों को प्रस्तुत करता है) में 1 मिलियन अंक प्रति फ्रेम से युक्त 120 मेगाबिट प्रति सेकंड से अधिक की आवश्यकता होती है, मानक उच्च-परिभाषा वीडियो के बैंडविड्थ से लगभग 10 गुना।

पारंपरिक दृष्टिकोणों के विपरीत, जो पहले भविष्यवाणी करते हैं कि एक उपयोगकर्ता कहां दिखेगा और फिर गणना करेगा कि क्या दिखाई दे रहा है, यह नई विधि सीधे 3 डी दृश्य में सामग्री दृश्यता की भविष्यवाणी करती है। इस दो-चरण प्रक्रिया से बचने से, दृष्टिकोण त्रुटि संचय को कम करता है और भविष्यवाणी सटीकता में सुधार करता है।

सिस्टम 3 डी स्पेस को “कोशिकाओं” में विभाजित करता है और प्रत्येक सेल को ग्राफ नेटवर्क में नोड के रूप में मानता है। यह पड़ोसी कोशिकाओं के बीच स्थानिक संबंधों को पकड़ने के लिए ट्रांसफार्मर-आधारित ग्राफ तंत्रिका नेटवर्क का उपयोग करता है, और समय के साथ दृश्यता पैटर्न कैसे विकसित होता है, इसका विश्लेषण करने के लिए आवर्तक तंत्रिका नेटवर्क।

पूर्व-रिकॉर्ड किए गए वर्चुअल रियलिटी अनुभवों के लिए, सिस्टम यह अनुमान लगा सकता है कि उपयोगकर्ता के 2-5 सेकंड से आगे क्या दिखाई देगा, पिछले सिस्टम पर एक महत्वपूर्ण सुधार जो केवल उपयोगकर्ता के FOV को एक दूसरे के आगे के एक अंश की सटीक भविष्यवाणी कर सकता है।

“जो इस काम को विशेष रूप से दिलचस्प बनाता है वह समय क्षितिज है,” लियू ने कहा। “पिछले सिस्टम केवल सटीक रूप से भविष्यवाणी कर सकते हैं कि एक उपयोगकर्ता एक दूसरे के आगे का एक अंश क्या देखेगा। इस टीम ने इसे बढ़ाया है।”

अनुसंधान टीम का दृष्टिकोण लंबी अवधि की भविष्यवाणियों के लिए मौजूदा तरीकों की तुलना में भविष्यवाणी त्रुटियों को 50% तक कम कर देता है, जबकि 1 मिलियन से अधिक अंक के साथ पॉइंट क्लाउड वीडियो के लिए प्रति सेकंड 30 से अधिक फ्रेम के वास्तविक समय के प्रदर्शन को बनाए रखता है।

उपभोक्ताओं के लिए, इसका मतलब कम डेटा उपयोग के साथ अधिक उत्तरदायी एआर/वीआर अनुभव हो सकता है, जबकि डेवलपर्स अल्ट्रा-फास्ट इंटरनेट कनेक्शन की आवश्यकता के बिना अधिक जटिल वातावरण बना सकते हैं।

“हम एक संक्रमण देख रहे हैं जहां एआर/वीआर विशेष अनुप्रयोगों से उपभोक्ता मनोरंजन और रोजमर्रा की उत्पादकता उपकरणों के लिए आगे बढ़ रहा है,” लियू ने कहा। “बैंडविड्थ एक बाधा रही है। यह शोध उस सीमा को संबोधित करने में मदद करता है।”

शोधकर्ताओं ने निरंतर विकास का समर्थन करने के लिए अपना कोड जारी किया। उनके काम को यूएस नेशनल साइंस फाउंडेशन (NSF) अनुदान 2312839 द्वारा भाग में समर्थित किया गया था।

लियू के अलावा, पेपर के लेखक चेन ली और टोंगू ज़ोंग दोनों एनवाईयू टंडन पीएचडी उम्मीदवारों दोनों इलेक्ट्रिकल इंजीनियरिंग में हैं; यूयू हू, एनवाईयू टंडन पीएच.डी. इलेक्ट्रिकल और इलेक्ट्रॉनिक्स इंजीनियरिंग में उम्मीदवार; और याओ वांग, एनवाईयू टंडन प्रोफेसर, जो ईसीई, बायोमेडिकल इंजीनियरिंग विभाग, सीएटीटी और एनवाईयू वायरलेस में बैठते हैं।



Source link

कोई जवाब दें

कृपया अपनी टिप्पणी दर्ज करें!
कृपया अपना नाम यहाँ दर्ज करें