सितंबर में, Openai ने CHATGPT के एक नए संस्करण का अनावरण किया कार्यों के माध्यम से तर्क के लिए डिज़ाइन किया गया गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग को शामिल करना। चैटबॉट के पिछले संस्करणों के विपरीत, यह नई तकनीक एक उत्तर पर बसने से पहले जटिल समस्याओं के माध्यम से “सोच” समय बिता सकती है।
जल्द ही, कंपनी ने कहा कि इसकी नई तर्क तकनीक थी उद्योग की प्रमुख प्रणालियों को बेहतर बनाया की एक श्रृंखला पर परीक्षण जो कृत्रिम बुद्धिमत्ता की प्रगति को ट्रैक करते हैं।
अब अन्य कंपनियां, जैसे गूगल, anthropic और चीन का दीपसेकसमान तकनीकों की पेशकश करें।
लेकिन क्या एआई वास्तव में एक मानव की तरह कारण हो सकता है? कंप्यूटर के लिए सोचने के लिए इसका क्या मतलब है? क्या ये सिस्टम वास्तव में सच्ची बुद्धिमत्ता से संपर्क कर रहे हैं?
यहाँ एक गाइड है।
एआई सिस्टम का कारण होने पर इसका क्या मतलब है?
तर्क देने का मतलब यह है कि चैटबॉट एक समस्या पर काम करने के लिए कुछ अतिरिक्त समय बिताता है।
“तर्क यह है कि जब सिस्टम प्रश्न पूछे जाने के बाद अतिरिक्त काम करता है,” कैलिफोर्निया विश्वविद्यालय, बर्कले, और स्केल्ड कॉग्निशन के मुख्य प्रौद्योगिकी अधिकारी, एआई स्टार्ट-अप के मुख्य प्रौद्योगिकी अधिकारी डैन क्लेन ने कहा।
यह व्यक्तिगत चरणों में एक समस्या को तोड़ सकता है या परीक्षण और त्रुटि के माध्यम से इसे हल करने का प्रयास कर सकता है।
मूल चैट ने तुरंत सवालों के जवाब दिए। नए तर्क प्रणाली कई सेकंड के लिए एक समस्या के माध्यम से काम कर सकती है – या यहां तक कि मिनट – जवाब देने से पहले।
क्या आप अधिक विशिष्ट हो सकते हैं?
कुछ मामलों में, एक तर्क प्रणाली एक प्रश्न के लिए अपने दृष्टिकोण को परिष्कृत करेगी, बार -बार उस विधि को बेहतर बनाने की कोशिश कर रही है जिसे उसने चुना है। अन्य समय, यह उनमें से एक पर बसने से पहले किसी समस्या के करीब पहुंचने के कई अलग -अलग तरीकों की कोशिश कर सकता है। या यह वापस जा सकता है और कुछ कामों की जांच कर सकता है जो कुछ सेकंड पहले किया था, बस यह देखने के लिए कि क्या यह सही था।
मूल रूप से, सिस्टम आपके प्रश्न का उत्तर देने के लिए जो कुछ भी कर सकता है वह कोशिश करता है।
यह एक ग्रेड स्कूल के छात्र की तरह है जो गणित की समस्या को हल करने के लिए एक रास्ता खोजने के लिए संघर्ष कर रहा है और कागज की एक शीट पर कई अलग -अलग विकल्पों को स्क्रिबल करता है।
किस तरह के प्रश्नों को AI सिस्टम की आवश्यकता होती है?
यह संभावित रूप से किसी भी चीज़ के बारे में कारण हो सकता है। लेकिन तर्क सबसे प्रभावी है जब आप गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग से जुड़े प्रश्न पूछते हैं।
एक तर्क चैटबॉट पहले चैटबॉट से अलग कैसे है?
आप पहले चैटबॉट्स से यह दिखाने के लिए कह सकते थे कि वे किसी विशेष उत्तर तक कैसे पहुंचे या अपने काम की जांच कर सकें। क्योंकि मूल चैट ने इंटरनेट पर पाठ से सीखा था, जहां लोगों ने दिखाया कि कैसे वे एक उत्तर के लिए मिल गए थे या अपने स्वयं के काम की जाँच की थी, यह इस तरह का आत्म-प्रतिबिंब भी कर सकता है।
लेकिन एक तर्क प्रणाली आगे बढ़ती है। यह इस तरह की चीजों को बिना पूछे कर सकता है। और यह उन्हें अधिक व्यापक और जटिल तरीकों से कर सकता है।
कंपनियां इसे एक तर्क प्रणाली कहती हैं क्योंकि ऐसा लगता है कि यह एक कठिन समस्या के माध्यम से सोचने वाले व्यक्ति की तरह अधिक संचालित होता है।
अब एआई तर्क क्यों महत्वपूर्ण है?
Openai जैसी कंपनियों का मानना है कि यह उनके चैटबॉट को बेहतर बनाने का सबसे अच्छा तरीका है।
वर्षों के लिए, इन कंपनियों ने एक साधारण अवधारणा पर भरोसा किया: अधिक इंटरनेट डेटा जो उन्होंने अपने चैटबॉट में पंप किया था, उन प्रणालियों ने जितना बेहतर प्रदर्शन किया।
लेकिन 2024 में, वे इंटरनेट पर लगभग सभी पाठ का उपयोग किया।
इसका मतलब है कि उन्हें अपने चैटबॉट को बेहतर बनाने के एक नए तरीके की आवश्यकता थी। इसलिए उन्होंने तर्क प्रणालियों का निर्माण शुरू कर दिया।
आप एक तर्क प्रणाली का निर्माण कैसे करते हैं?
पिछले साल, ओपनई जैसी कंपनियां सुदृढीकरण सीखने वाली एक तकनीक पर भारी पड़ने लगीं।
इस प्रक्रिया के माध्यम से – जो महीनों तक विस्तारित हो सकता है – एक एआई प्रणाली व्यापक परीक्षण और त्रुटि के माध्यम से व्यवहार सीख सकती है। उदाहरण के लिए, हजारों गणित की समस्याओं के माध्यम से काम करके, यह सीख सकता है कि कौन से तरीके सही उत्तर की ओर ले जाते हैं और कौन सा नहीं।
शोधकर्ताओं ने जटिल प्रतिक्रिया तंत्र डिजाइन किए हैं जो सिस्टम को दिखाते हैं जब उसने कुछ सही किया है और जब इसने कुछ गलत किया है।
“यह एक कुत्ते को प्रशिक्षित करने जैसा है,” एक ओपनईई शोधकर्ता जेरी ट्वोरेक ने कहा। “अगर सिस्टम अच्छा करता है, तो आप इसे एक कुकी देते हैं। अगर यह अच्छा नहीं करता है, तो आप कहते हैं, ‘बैड डॉग।”
(दी न्यू यौर्क टाइम्स पर मुकदमा दायर Openai और उसके साथी, Microsoft, दिसंबर में AI सिस्टम से संबंधित समाचार सामग्री के कॉपीराइट उल्लंघन के लिए।)
क्या सुदृढीकरण सीखने का काम करता है?
यह कुछ क्षेत्रों में बहुत अच्छी तरह से काम करता है, जैसे गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग। ये ऐसे क्षेत्र हैं जहां कंपनियां स्पष्ट रूप से अच्छे व्यवहार और बुरे को परिभाषित कर सकती हैं। गणित की समस्याओं के निश्चित उत्तर हैं।
सुदृढीकरण सीखना रचनात्मक लेखन, दर्शन और नैतिकता जैसे क्षेत्रों में भी काम नहीं करता है, जहां अच्छे और बुरे के बीच का अंतर पिन करना कठिन है। शोधकर्ताओं का कहना है कि यह प्रक्रिया आम तौर पर एआई सिस्टम के प्रदर्शन में सुधार कर सकती है, तब भी जब यह गणित और विज्ञान के बाहर सवालों के जवाब देती है।
“यह धीरे -धीरे सीखता है कि तर्क के पैटर्न इसे सही दिशा में ले जाते हैं और जो नहीं करते हैं,” एंथ्रोपिक के मुख्य विज्ञान अधिकारी जेरेड कपलान ने कहा।
क्या सुदृढीकरण सीखने और तर्क प्रणाली एक ही बात है?
नहीं। सुदृढीकरण सीखना वह विधि है जिसका उपयोग कंपनियां तर्क प्रणालियों के निर्माण के लिए करती हैं। यह प्रशिक्षण चरण है जो अंततः चैटबॉट्स को तर्क करने की अनुमति देता है।
क्या ये तर्क प्रणालियां अभी भी गलतियाँ करती हैं?
बिल्कुल। एक चैटबॉट सब कुछ संभावनाओं पर आधारित है। यह एक ऐसा रास्ता चुनता है जो उस डेटा से सबसे अधिक सीखा है – चाहे वह डेटा इंटरनेट से आया हो या सुदृढीकरण सीखने के माध्यम से उत्पन्न हुआ हो। कभी -कभी यह एक विकल्प चुनता है जो गलत है या समझ में नहीं आता है।
क्या यह एक ऐसी मशीन का रास्ता है जो मानव बुद्धिमत्ता से मेल खाती है?
एआई विशेषज्ञों को इस प्रश्न पर विभाजित किया गया है। ये तरीके अभी भी अपेक्षाकृत नए हैं, और शोधकर्ता अभी भी अपनी सीमाओं को समझने की कोशिश कर रहे हैं। एआई क्षेत्र में, नए तरीके अक्सर धीमा होने से पहले अक्सर बहुत जल्दी प्रगति करते हैं।