जब दृश्य जानकारी मस्तिष्क में प्रवेश करती है, तो यह दो मार्गों के माध्यम से यात्रा करता है जो इनपुट के विभिन्न पहलुओं को संसाधित करते हैं। दशकों के लिए, वैज्ञानिकों ने परिकल्पना की है कि इनमें से एक मार्ग, वेंट्रल विजुअल स्ट्रीम, वस्तुओं को पहचानने के लिए जिम्मेदार है, और यह कि यह केवल ऐसा करने के लिए विकास द्वारा अनुकूलित किया गया हो सकता है।

इसके अनुरूप, पिछले एक दशक में, एमआईटी वैज्ञानिकों ने पाया है कि जब वेंट्रल स्ट्रीम के शरीर रचना के कम्प्यूटेशनल मॉडल को ऑब्जेक्ट मान्यता के कार्य को हल करने के लिए अनुकूलित किया जाता है, तो वे वेंट्रल स्ट्रीम में तंत्रिका गतिविधियों के अच्छे भविष्यवक्ता हैं।

हालांकि, एक नए अध्ययन में, एमआईटी शोधकर्ताओं ने दिखाया है कि जब वे इस प्रकार के मॉडल को स्थानिक कार्यों पर प्रशिक्षित करते हैं, तो परिणामी मॉडल भी वेंट्रल स्ट्रीम की तंत्रिका गतिविधियों के काफी अच्छे भविष्यवक्ता होते हैं। इससे पता चलता है कि वेंट्रल स्ट्रीम ऑब्जेक्ट मान्यता के लिए विशेष रूप से अनुकूलित नहीं हो सकती है।

“यह इस सवाल के बारे में व्यापक रूप से खुला है कि वेंट्रल स्ट्रीम के लिए किसके लिए अनुकूलित किया जा रहा है। मुझे लगता है कि हमारे क्षेत्र में बहुत से लोग बहुत से लोगों का मानना ​​है कि वेंट्रल स्ट्रीम ऑब्जेक्ट मान्यता के लिए अनुकूलित है, लेकिन यह अध्ययन एक नया परिप्रेक्ष्य प्रदान करता है कि वेंट्रल स्ट्रीम को स्थानिक कार्यों के लिए भी अनुकूलित किया जा सकता है,” मिट ग्रेजुएट स्टूडेंट युडी एक्सी कहते हैं।

XIE अध्ययन के प्रमुख लेखक हैं, जिसे लर्निंग अभ्यावेदन पर अंतर्राष्ट्रीय सम्मेलन में प्रस्तुत किया जाएगा। पेपर के अन्य लेखकों में एमआईटी के रिसर्च समर इंस्टीट्यूट प्रोग्राम के माध्यम से एक विजिटिंग छात्र वीचेन हुआंग शामिल हैं; एस्तेर ऑल्टर, इंटेलिजेंस के लिए एमआईटी क्वेस्ट में एक सॉफ्टवेयर इंजीनियर; जेरेमी श्वार्ट्ज, एक प्रायोजित अनुसंधान तकनीकी स्टाफ सदस्य; जोशुआ टेनेनबाम, मस्तिष्क और संज्ञानात्मक विज्ञान के एक प्रोफेसर; और जेम्स डिकार्लो, ब्रेन एंड कॉग्निटिव साइंसेज के पीटर डी फ्लोरेज़ प्रोफेसर, द क्वेस्ट फॉर इंटेलिजेंस के निदेशक, और एमआईटी में ब्रेन रिसर्च के लिए मैकगवर्न इंस्टीट्यूट के सदस्य।

वस्तु मान्यता से परे

जब हम किसी वस्तु को देखते हैं, तो हमारी दृश्य प्रणाली न केवल ऑब्जेक्ट की पहचान कर सकती है, बल्कि अन्य विशेषताओं को भी निर्धारित कर सकती है जैसे कि इसका स्थान, इसकी दूरी हमसे, और अंतरिक्ष में इसके अभिविन्यास। 1980 के दशक की शुरुआत से, न्यूरोसाइंटिस्टों ने परिकल्पना की है कि प्राइमेट विजुअल सिस्टम को दो मार्गों में विभाजित किया गया है: वेंट्रल स्ट्रीम, जो ऑब्जेक्ट-रिकग्निशन कार्यों और पृष्ठीय धारा को करता है, जो स्थानिक स्थान से संबंधित सुविधाओं को संसाधित करता है।

पिछले एक दशक में, शोधकर्ताओं ने वेंट्रल स्ट्रीम को एक प्रकार के गहरे-सीखने वाले मॉडल का उपयोग करके काम किया है, जिसे एक कन्वेन्टल न्यूरल नेटवर्क (सीएनएन) के रूप में जाना जाता है। शोधकर्ता इन मॉडलों को ऑब्जेक्ट-रिकग्निशन कार्यों को करने के लिए प्रशिक्षित कर सकते हैं, जिसमें उन्हें छवियों का वर्णन करने वाले श्रेणी लेबल के साथ-साथ हजारों छवियों वाले डेटासेट को खिलाया जा सकता है।

इन सीएनएन के अत्याधुनिक संस्करणों में छवियों को वर्गीकृत करने में उच्च सफलता दर है। इसके अतिरिक्त, शोधकर्ताओं ने पाया है कि मॉडल की आंतरिक सक्रियता न्यूरॉन्स की गतिविधियों के समान है जो वेंट्रल स्ट्रीम में दृश्य जानकारी को संसाधित करती हैं। इसके अलावा, ये मॉडल उतने ही वेंट्रल स्ट्रीम के समान होते हैं, वे बेहतर प्रदर्शन करते हैं। इसने कई शोधकर्ताओं को इस बात की परिकल्पना करने के लिए प्रेरित किया है कि वेंट्रल स्ट्रीम का प्रमुख कार्य वस्तुओं को पहचान रहा है।

हालांकि, प्रायोगिक अध्ययन, विशेष रूप से 2016 में डिकार्लो लैब से एक अध्ययन, ने पाया है कि उदर धारा स्थानिक विशेषताओं को भी एनकोड करने के लिए प्रकट होती है। इन विशेषताओं में ऑब्जेक्ट का आकार, इसका अभिविन्यास (इसे कितना घुमाया जाता है), और देखने के क्षेत्र के भीतर इसका स्थान शामिल है। इन अध्ययनों के आधार पर, MIT टीम ने यह जांचने का लक्ष्य रखा कि क्या वेंट्रल स्ट्रीम ऑब्जेक्ट मान्यता से परे अतिरिक्त कार्य कर सकता है।

“इस परियोजना में हमारा केंद्रीय प्रश्न था, क्या यह संभव है कि हम वेंट्रल स्ट्रीम के बारे में सोच सकते हैं क्योंकि इन स्थानिक कार्यों को केवल वर्गीकरण कार्यों के बजाय अनुकूलित किया जा सकता है?” Xie कहते हैं।

इस परिकल्पना का परीक्षण करने के लिए, शोधकर्ताओं ने रोटेशन, स्थान और दूरी सहित किसी वस्तु की एक या अधिक स्थानिक विशेषताओं की पहचान करने के लिए सीएनएन को प्रशिक्षित करने के लिए निर्धारित किया। मॉडलों को प्रशिक्षित करने के लिए, उन्होंने सिंथेटिक छवियों का एक नया डेटासेट बनाया। ये छवियां चाय केटल्स या कैलकुलेटर जैसी वस्तुओं को अलग -अलग पृष्ठभूमि पर, उन स्थानों और झुकावों में दिखाती हैं, जिन्हें मॉडल को सीखने में मदद करने के लिए लेबल किया जाता है।

शोधकर्ताओं ने पाया कि सीएनएन जो इन स्थानिक कार्यों में से एक पर प्रशिक्षित थे, वे उदर धारा के साथ “न्यूरो-संरेखण” का एक उच्च स्तर दिखाते हैं-ऑब्जेक्ट मान्यता पर प्रशिक्षित सीएनएन मॉडल में देखे गए स्तरों के समान।

शोधकर्ता एक ऐसी तकनीक का उपयोग करके न्यूरो-संरेखण को मापते हैं जिसे डिकार्लो की प्रयोगशाला विकसित हुई है, जिसमें मॉडल से पूछना शामिल है, एक बार प्रशिक्षित, तंत्रिका गतिविधि की भविष्यवाणी करने के लिए कि एक विशेष छवि मस्तिष्क में उत्पन्न होगी। शोधकर्ताओं ने पाया कि जिस स्थानिक कार्य पर उन्हें प्रशिक्षित किया गया था, वह जितना बेहतर था, उतना बेहतर न्यूरो-संरेखण उन्होंने दिखाया था।

“मुझे लगता है कि हम यह नहीं मान सकते हैं कि वेंट्रल स्ट्रीम केवल ऑब्जेक्ट वर्गीकरण कर रहा है, क्योंकि इनमें से कई अन्य कार्य, जैसे कि स्थानिक कार्य, मॉडल के न्यूरो-संरेखण और उनके प्रदर्शन के बीच इस मजबूत सहसंबंध को भी जन्म दे सकते हैं,” ज़ी कहते हैं। “हमारा निष्कर्ष यह है कि आप या तो वर्गीकरण के माध्यम से या इन स्थानिक कार्यों को करने का अनुकूलन कर सकते हैं, और वे दोनों आपको न्यूरो-संरेखण का मूल्यांकन करने के लिए हमारे वर्तमान मैट्रिक्स के आधार पर एक वेंट्रल-स्ट्रीम-जैसे मॉडल देते हैं।”

मॉडल की तुलना करना

शोधकर्ताओं ने तब जांच की कि इन दो दृष्टिकोणों-स्थानिक सुविधाओं के लिए वस्तु मान्यता और प्रशिक्षण के लिए प्रशिक्षण-न्यूरो-संरेखण के समान डिग्री का नेतृत्व किया। ऐसा करने के लिए, उन्होंने एक विश्लेषण किया जिसे केंद्रित कर्नेल संरेखण (CKA) के रूप में जाना जाता है, जो उन्हें विभिन्न CNN में अभ्यावेदन के बीच समानता की डिग्री को मापने की अनुमति देता है। इस विश्लेषण से पता चला कि मॉडलों की शुरुआती मध्य परतों में, मॉडल जो प्रतिनिधित्व सीखते हैं, वे लगभग अप्रभेद्य हैं।

“इन शुरुआती परतों में, अनिवार्य रूप से आप इन मॉडलों को केवल उनके प्रतिनिधित्व को देखकर अलग नहीं बता सकते हैं,” ज़ी कहते हैं। “ऐसा लगता है कि वे मध्य परतों की शुरुआत में कुछ समान या एकीकृत प्रतिनिधित्व सीखते हैं, और बाद के चरणों में वे विभिन्न कार्यों का समर्थन करने के लिए विचलन करते हैं।”

शोधकर्ताओं की परिकल्पना है कि जब मॉडल को केवल एक सुविधा का विश्लेषण करने के लिए प्रशिक्षित किया जाता है, तो वे “गैर-लक्ष्य” सुविधाओं को भी ध्यान में रखते हैं-जिन्हें वे प्रशिक्षित नहीं करते हैं। जब ऑब्जेक्ट्स में गैर-लक्ष्य सुविधाओं में अधिक परिवर्तनशीलता होती है, तो मॉडल अन्य कार्यों पर प्रशिक्षित मॉडल द्वारा सीखे गए लोगों के समान प्रतिनिधित्व सीखते हैं। इससे पता चलता है कि मॉडल उनके लिए उपलब्ध सभी जानकारी का उपयोग कर रहे हैं, जिसके परिणामस्वरूप अलग -अलग मॉडल समान अभ्यावेदन के साथ आ सकते हैं, शोधकर्ताओं का कहना है।

“अधिक गैर-लक्ष्य परिवर्तनशीलता वास्तव में मॉडल को एक बेहतर प्रतिनिधित्व सीखने में मदद करती है, बजाय एक प्रतिनिधित्व सीखने के लिए जो उनसे अनभिज्ञ है,” ज़ी कहते हैं। “यह संभव है कि मॉडल, हालांकि वे एक लक्ष्य पर प्रशिक्षित हैं, इन गैर-लक्ष्य सुविधाओं की परिवर्तनशीलता के कारण एक साथ अन्य चीजों को सीख रहे हैं।”

भविष्य के काम में, शोधकर्ताओं को विभिन्न मॉडलों की तुलना करने के लिए नए तरीके विकसित करने की उम्मीद है, इस बारे में अधिक सीखने की उम्मीद में कि प्रत्येक व्यक्ति प्रशिक्षण कार्यों और प्रशिक्षण डेटा में अंतर के आधार पर वस्तुओं के आंतरिक प्रतिनिधित्व को कैसे विकसित करता है।

“इन मॉडलों के बीच अभी भी मामूली अंतर हो सकता है, भले ही यह मापने का हमारा वर्तमान तरीका है कि मस्तिष्क के समान समान हैं, हमें बताता है कि वे बहुत समान स्तर पर हैं। यह बताता है कि शायद अभी भी कुछ काम करने के लिए किया जा सकता है कि हम मॉडल की तुलना मस्तिष्क से कैसे कर सकते हैं, ताकि हम बेहतर समझ सकें कि वास्तव में वेंट्रल स्ट्रीम क्या है, इसके लिए क्या अनुकूलित है,” शी कहते हैं।

अनुसंधान को सेमीकंडक्टर रिसर्च कॉरपोरेशन और अमेरिकी डिफेंस एडवांस्ड रिसर्च प्रोजेक्ट्स एजेंसी द्वारा वित्त पोषित किया गया था।



Source link

कोई जवाब दें

कृपया अपनी टिप्पणी दर्ज करें!
कृपया अपना नाम यहाँ दर्ज करें