सितंबर में, Openai ने CHATGPT के एक नए संस्करण का अनावरण किया कार्यों के माध्यम से तर्क के लिए डिज़ाइन किया गया गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग को शामिल करना। चैटबॉट के पिछले संस्करणों के विपरीत, यह नई तकनीक एक उत्तर पर बसने से पहले जटिल समस्याओं के माध्यम से “सोच” समय बिता सकती है।

जल्द ही, कंपनी ने कहा कि इसकी नई तर्क तकनीक थी उद्योग की प्रमुख प्रणालियों को बेहतर बनाया की एक श्रृंखला पर परीक्षण जो कृत्रिम बुद्धिमत्ता की प्रगति को ट्रैक करते हैं

अब अन्य कंपनियां, जैसे गूगल, anthropic और चीन का दीपसेकसमान तकनीकों की पेशकश करें।

लेकिन क्या एआई वास्तव में एक मानव की तरह कारण हो सकता है? कंप्यूटर के लिए सोचने के लिए इसका क्या मतलब है? क्या ये सिस्टम वास्तव में सच्ची बुद्धिमत्ता से संपर्क कर रहे हैं?

यहाँ एक गाइड है।

तर्क देने का मतलब यह है कि चैटबॉट एक समस्या पर काम करने के लिए कुछ अतिरिक्त समय बिताता है।

“तर्क यह है कि जब सिस्टम प्रश्न पूछे जाने के बाद अतिरिक्त काम करता है,” कैलिफोर्निया विश्वविद्यालय, बर्कले, और स्केल्ड कॉग्निशन के मुख्य प्रौद्योगिकी अधिकारी, एआई स्टार्ट-अप के मुख्य प्रौद्योगिकी अधिकारी डैन क्लेन ने कहा।

यह व्यक्तिगत चरणों में एक समस्या को तोड़ सकता है या परीक्षण और त्रुटि के माध्यम से इसे हल करने का प्रयास कर सकता है।

मूल चैट ने तुरंत सवालों के जवाब दिए। नए तर्क प्रणाली कई सेकंड के लिए एक समस्या के माध्यम से काम कर सकती है – या यहां तक ​​कि मिनट – जवाब देने से पहले।

कुछ मामलों में, एक तर्क प्रणाली एक प्रश्न के लिए अपने दृष्टिकोण को परिष्कृत करेगी, बार -बार उस विधि को बेहतर बनाने की कोशिश कर रही है जिसे उसने चुना है। अन्य समय, यह उनमें से एक पर बसने से पहले किसी समस्या के करीब पहुंचने के कई अलग -अलग तरीकों की कोशिश कर सकता है। या यह वापस जा सकता है और कुछ कामों की जांच कर सकता है जो कुछ सेकंड पहले किया था, बस यह देखने के लिए कि क्या यह सही था।

मूल रूप से, सिस्टम आपके प्रश्न का उत्तर देने के लिए जो कुछ भी कर सकता है वह कोशिश करता है।

यह एक ग्रेड स्कूल के छात्र की तरह है जो गणित की समस्या को हल करने के लिए एक रास्ता खोजने के लिए संघर्ष कर रहा है और कागज की एक शीट पर कई अलग -अलग विकल्पों को स्क्रिबल करता है।

यह संभावित रूप से किसी भी चीज़ के बारे में कारण हो सकता है। लेकिन तर्क सबसे प्रभावी है जब आप गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग से जुड़े प्रश्न पूछते हैं।

आप पहले चैटबॉट्स से यह दिखाने के लिए कह सकते थे कि वे किसी विशेष उत्तर तक कैसे पहुंचे या अपने काम की जांच कर सकें। क्योंकि मूल चैट ने इंटरनेट पर पाठ से सीखा था, जहां लोगों ने दिखाया कि कैसे वे एक उत्तर के लिए मिल गए थे या अपने स्वयं के काम की जाँच की थी, यह इस तरह का आत्म-प्रतिबिंब भी कर सकता है।

लेकिन एक तर्क प्रणाली आगे बढ़ती है। यह इस तरह की चीजों को बिना पूछे कर सकता है। और यह उन्हें अधिक व्यापक और जटिल तरीकों से कर सकता है।

कंपनियां इसे एक तर्क प्रणाली कहती हैं क्योंकि ऐसा लगता है कि यह एक कठिन समस्या के माध्यम से सोचने वाले व्यक्ति की तरह अधिक संचालित होता है।

Openai जैसी कंपनियों का मानना ​​है कि यह उनके चैटबॉट को बेहतर बनाने का सबसे अच्छा तरीका है।

वर्षों के लिए, इन कंपनियों ने एक साधारण अवधारणा पर भरोसा किया: अधिक इंटरनेट डेटा जो उन्होंने अपने चैटबॉट में पंप किया था, उन प्रणालियों ने जितना बेहतर प्रदर्शन किया

लेकिन 2024 में, वे इंटरनेट पर लगभग सभी पाठ का उपयोग किया

इसका मतलब है कि उन्हें अपने चैटबॉट को बेहतर बनाने के एक नए तरीके की आवश्यकता थी। इसलिए उन्होंने तर्क प्रणालियों का निर्माण शुरू कर दिया।

पिछले साल, ओपनई जैसी कंपनियां सुदृढीकरण सीखने वाली एक तकनीक पर भारी पड़ने लगीं।

इस प्रक्रिया के माध्यम से – जो महीनों तक विस्तारित हो सकता है – एक एआई प्रणाली व्यापक परीक्षण और त्रुटि के माध्यम से व्यवहार सीख सकती है। उदाहरण के लिए, हजारों गणित की समस्याओं के माध्यम से काम करके, यह सीख सकता है कि कौन से तरीके सही उत्तर की ओर ले जाते हैं और कौन सा नहीं।

शोधकर्ताओं ने जटिल प्रतिक्रिया तंत्र डिजाइन किए हैं जो सिस्टम को दिखाते हैं जब उसने कुछ सही किया है और जब इसने कुछ गलत किया है।

“यह एक कुत्ते को प्रशिक्षित करने जैसा है,” एक ओपनईई शोधकर्ता जेरी ट्वोरेक ने कहा। “अगर सिस्टम अच्छा करता है, तो आप इसे एक कुकी देते हैं। अगर यह अच्छा नहीं करता है, तो आप कहते हैं, ‘बैड डॉग।”

(दी न्यू यौर्क टाइम्स पर मुकदमा दायर Openai और उसके साथी, Microsoft, दिसंबर में AI सिस्टम से संबंधित समाचार सामग्री के कॉपीराइट उल्लंघन के लिए।)

यह कुछ क्षेत्रों में बहुत अच्छी तरह से काम करता है, जैसे गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग। ये ऐसे क्षेत्र हैं जहां कंपनियां स्पष्ट रूप से अच्छे व्यवहार और बुरे को परिभाषित कर सकती हैं। गणित की समस्याओं के निश्चित उत्तर हैं।

सुदृढीकरण सीखना रचनात्मक लेखन, दर्शन और नैतिकता जैसे क्षेत्रों में भी काम नहीं करता है, जहां अच्छे और बुरे के बीच का अंतर पिन करना कठिन है। शोधकर्ताओं का कहना है कि यह प्रक्रिया आम तौर पर एआई सिस्टम के प्रदर्शन में सुधार कर सकती है, तब भी जब यह गणित और विज्ञान के बाहर सवालों के जवाब देती है।

“यह धीरे -धीरे सीखता है कि तर्क के पैटर्न इसे सही दिशा में ले जाते हैं और जो नहीं करते हैं,” एंथ्रोपिक के मुख्य विज्ञान अधिकारी जेरेड कपलान ने कहा।

नहीं। सुदृढीकरण सीखना वह विधि है जिसका उपयोग कंपनियां तर्क प्रणालियों के निर्माण के लिए करती हैं। यह प्रशिक्षण चरण है जो अंततः चैटबॉट्स को तर्क करने की अनुमति देता है।

बिल्कुल। एक चैटबॉट सब कुछ संभावनाओं पर आधारित है। यह एक ऐसा रास्ता चुनता है जो उस डेटा से सबसे अधिक सीखा है – चाहे वह डेटा इंटरनेट से आया हो या सुदृढीकरण सीखने के माध्यम से उत्पन्न हुआ हो। कभी -कभी यह एक विकल्प चुनता है जो गलत है या समझ में नहीं आता है।

एआई विशेषज्ञों को इस प्रश्न पर विभाजित किया गया है। ये तरीके अभी भी अपेक्षाकृत नए हैं, और शोधकर्ता अभी भी अपनी सीमाओं को समझने की कोशिश कर रहे हैं। एआई क्षेत्र में, नए तरीके अक्सर धीमा होने से पहले अक्सर बहुत जल्दी प्रगति करते हैं।



Source link