एन्थ्रोपिक सीईओ डारियो अमोडी एक निबंध प्रकाशित किया गुरुवार को इस बात पर प्रकाश डाला गया कि दुनिया के प्रमुख एआई मॉडल के आंतरिक कामकाज के बारे में कम शोधकर्ता कैसे समझते हैं। उस संबोधित करने के लिए, Amodei ने 2027 तक अधिकांश AI मॉडल समस्याओं का मज़बूती से पता लगाने के लिए एन्थ्रोपिक के लिए एक महत्वाकांक्षी लक्ष्य निर्धारित किया।
Amodei आगे की चुनौती को स्वीकार करता है। “व्याख्या की तात्कालिकता” में, सीईओ का कहना है कि एंथ्रोपिक ने यह पता लगाने में शुरुआती सफलताओं को बनाया है कि मॉडल अपने उत्तरों में कैसे पहुंचते हैं – लेकिन इस बात पर जोर देता है कि इन प्रणालियों को डिकोड करने के लिए कहीं अधिक शोध की आवश्यकता है क्योंकि वे अधिक शक्तिशाली हो जाते हैं।
“मैं इस तरह की प्रणालियों को व्याख्याता पर एक बेहतर हैंडल के बिना तैनात करने के बारे में बहुत चिंतित हूं,” अमोडी ने निबंध में लिखा है। “ये सिस्टम अर्थव्यवस्था, प्रौद्योगिकी और राष्ट्रीय सुरक्षा के लिए बिल्कुल केंद्रीय होंगे, और इतनी स्वायत्तता के लिए सक्षम होंगे कि मैं इसे मूल रूप से मानवता के लिए अस्वीकार्य मानता हूं कि वे पूरी तरह से अनभिज्ञ हों कि वे कैसे काम करते हैं।”
एंथ्रोपिक यंत्रवत व्याख्याता में अग्रणी कंपनियों में से एक है, एक ऐसा क्षेत्र जो एआई मॉडल के ब्लैक बॉक्स को खोलना और यह समझना है कि वे निर्णय क्यों लेते हैं। टेक उद्योग के एआई मॉडल के तेजी से प्रदर्शन में सुधार के बावजूद, हमारे पास अभी भी अपेक्षाकृत कम विचार है कि ये सिस्टम निर्णयों पर कैसे पहुंचते हैं।
उदाहरण के लिए, Openai ने हाल ही में नए रीज़निंग AI मॉडल, O3 और O4-Mini लॉन्च किए, जो कुछ कार्यों पर बेहतर प्रदर्शन करते हैं, लेकिन यह भी इसके अन्य मॉडलों की तुलना में अधिक मतिभ्रम। कंपनी को पता नहीं है कि यह क्यों हो रहा है।
“जब एक सामान्य एआई सिस्टम कुछ करता है, जैसे कि एक वित्तीय दस्तावेज को संक्षेप में प्रस्तुत करता है, तो हमारे पास कोई विचार नहीं है, एक विशिष्ट या सटीक स्तर पर, यह विकल्प क्यों बनाता है – क्यों यह दूसरों पर कुछ शब्दों को चुनता है, या क्यों कभी -कभी सटीक होने के बावजूद गलती करता है,” अमोडी ने निबंध में लिखा है।
निबंध में, अमोडी ने नोट किया कि एन्थ्रोपिक सह-संस्थापक क्रिस ओलाह का कहना है कि एआई मॉडल “जितना वे बनाए गए हैं उससे अधिक बढ़े हुए हैं।” दूसरे शब्दों में, एआई के शोधकर्ताओं ने एआई मॉडल खुफिया को बेहतर बनाने के तरीके खोजे हैं, लेकिन वे यह नहीं जानते कि क्यों।
निबंध में, अमोडी का कहना है कि एजीआई तक पहुंचना खतरनाक हो सकता है – या जैसा कि वह इसे कहता है, “एक डेटा सेंटर में प्रतिभाओं का एक देश” – यह समझे बिना कि ये मॉडल कैसे काम करते हैं। पिछले निबंध में, अमोडी ने दावा किया कि तकनीकी उद्योग 2026 या 2027 तक इस तरह के मील के पत्थर तक पहुंच सकता है, लेकिन मानते हैं कि हम इन एआई मॉडल को पूरी तरह से समझने से बहुत आगे हैं।
लंबी अवधि में, अमोडी का कहना है कि एन्थ्रोपिक, अनिवार्य रूप से, अत्याधुनिक एआई मॉडल के “ब्रेन स्कैन” या “एमआरआई” का संचालन करना चाहेगा। वे कहते हैं कि ये चेकअप एआई मॉडल में मुद्दों की एक विस्तृत श्रृंखला की पहचान करने में मदद करेंगे, जिसमें उनकी प्रवृत्ति झूठ या शक्ति की तलाश करने या अन्य कमजोरी की तलाश है, वे कहते हैं। उन्होंने कहा कि इसे प्राप्त करने में पांच से 10 साल लग सकते हैं, लेकिन इन उपायों को एंथ्रोपिक के भविष्य के एआई मॉडल का परीक्षण करने और तैनात करने के लिए आवश्यक होगा।
एंथ्रोपिक ने कुछ शोध सफलताओं को बनाया है, जिन्होंने इसे बेहतर ढंग से समझने की अनुमति दी है कि इसके एआई मॉडल कैसे काम करते हैं। उदाहरण के लिए, कंपनी ने हाल ही में तरीके खोजे एक एआई मॉडल के सोच मार्गों के माध्यम से ट्रेस करेंकंपनी क्या कहती है, सर्किट। एंथ्रोपिक ने एक सर्किट की पहचान की जो एआई मॉडल को यह समझने में मदद करती है कि अमेरिकी शहर कौन से हैं, जिसमें अमेरिकी राज्यों में स्थित है। कंपनी ने केवल इनमें से कुछ सर्किट पाए हैं, लेकिन अनुमान है कि एआई मॉडल के भीतर लाखों हैं।
एन्थ्रोपिक इंटरप्रिटेबिलिटी रिसर्च में ही निवेश कर रहा है और हाल ही में बनाया गया है एक स्टार्टअप में इसका पहला निवेश व्याख्या पर काम करना। जबकि व्याख्याता को काफी हद तक सुरक्षा अनुसंधान के एक क्षेत्र के रूप में देखा जाता है, Amodei नोट करता है कि, आखिरकार, यह बताते हुए कि AI मॉडल अपने उत्तरों में कैसे पहुंचते हैं, यह एक व्यावसायिक लाभ पेश कर सकता है।
निबंध में, अमोडी ने ओपनई और गूगल डीपमाइंड को क्षेत्र में अपने शोध प्रयासों को बढ़ाने के लिए बुलाया। दोस्ताना कुहनी से परे, एन्थ्रोपिक के सीईओ ने सरकारों को व्याख्याता अनुसंधान को प्रोत्साहित करने के लिए “लाइट-टच” नियमों को लागू करने के लिए कहा, जैसे कि कंपनियों के लिए अपनी सुरक्षा और सुरक्षा प्रथाओं का खुलासा करने की आवश्यकताएं। निबंध में, Amodei यह भी कहता है कि अमेरिका को चीन में चिप्स पर निर्यात नियंत्रण रखना चाहिए, ताकि एक आउट-ऑफ-कंट्रोल, ग्लोबल एआई दौड़ की संभावना को सीमित किया जा सके।
एंथ्रोपिक हमेशा ओपनई और गूगल से सुरक्षा पर ध्यान केंद्रित करने के लिए बाहर खड़ा है। जबकि अन्य तकनीकी कंपनियों ने कैलिफोर्निया के विवादास्पद एआई सुरक्षा बिल, एसबी 1047 पर पीछे धकेल दिया, एंथ्रोपिक ने बिल के लिए मामूली समर्थन और सिफारिशें जारी कींजो फ्रंटियर एआई मॉडल डेवलपर्स के लिए सुरक्षा रिपोर्टिंग मानकों को निर्धारित करेगा।
इस मामले में, एन्थ्रोपिक एआई मॉडल को बेहतर ढंग से समझने के लिए उद्योग-व्यापी प्रयास के लिए जोर दे रहा है, न कि केवल उनकी क्षमताओं को बढ़ाने के लिए।