दीपसेक वायरल हो गया है।
चीनी एआई लैब डीपसेक इस सप्ताह के बाद मुख्यधारा की चेतना में टूट गया इसका चैटबॉट ऐप Apple ऐप स्टोर चार्ट के शीर्ष पर पहुंच गया (और Google Play, साथ ही साथ)। दीपसेक के एआई मॉडल, जिन्हें गणना-कुशल तकनीकों का उपयोग करके प्रशिक्षित किया गया था, वॉल स्ट्रीट विश्लेषकों का नेतृत्व किया है – और प्रौद्योगिकीविद् – यह सवाल करने के लिए कि क्या अमेरिका एआई दौड़ में अपनी बढ़त बनाए रख सकता है और क्या एआई चिप्स की मांग बनाए रखेगी।
लेकिन दीपसेक कहां से आया, और यह इतनी जल्दी अंतर्राष्ट्रीय प्रसिद्धि के लिए कैसे बढ़ी?
दीपसेक के व्यापारी मूल
दीपसेक उच्च-फ्लाइर कैपिटल मैनेजमेंट द्वारा समर्थित है, एक चीनी मात्रात्मक हेज फंड जो अपने व्यापारिक निर्णयों को सूचित करने के लिए एआई का उपयोग करता है।
एआई उत्साही लिआंग वेनफेंग 2015 में हाई-फ्लाइर की सह-स्थापना की। वेनफेंग, जिन्होंने कथित तौर पर ट्रेडिंग में डबिंग करना शुरू कर दिया, जबकि झेजियांग विश्वविद्यालय में एक छात्र ने 2019 में हेज फंड के रूप में उच्च-फ्लाइर कैपिटल मैनेजमेंट को लॉन्च किया, जो एआई एल्गोरिदम को विकसित करने और तैनात करने पर केंद्रित था।
2023 में, हाई-फ्लाइर ने डीपसेक को अपने वित्तीय व्यवसाय से अलग एआई टूल्स पर शोध करने के लिए समर्पित एक प्रयोगशाला के रूप में शुरू किया। अपने निवेशकों में से एक के रूप में हाई-फ्लायर के साथ, लैब अपनी कंपनी में बंद हो गया, जिसे दीपसेक भी कहा जाता है।
पहले दिन से, डीपसेक ने मॉडल प्रशिक्षण के लिए अपने स्वयं के डेटा सेंटर क्लस्टर का निर्माण किया। लेकिन चीन में अन्य एआई कंपनियों की तरह, हार्डवेयर पर यूएस एक्सपोर्ट बैन से दीपसेक प्रभावित हुआ है। अपने हाल के मॉडलों में से एक को प्रशिक्षित करने के लिए, कंपनी को NVIDIA H800 चिप्स का उपयोग करने के लिए मजबूर किया गया था, जो एक चिप का कम शक्तिशाली संस्करण, H100, अमेरिकी कंपनियों के लिए उपलब्ध है।
दीपसेक की तकनीकी टीम को कमज़ोर युवा कहा जाता है। कंपनी कथित तौर पर आक्रामक रूप से भर्ती शीर्ष चीनी विश्वविद्यालयों के डॉक्टरेट एआई शोधकर्ताओं। दीपसेक भी बिना किसी कंप्यूटर विज्ञान पृष्ठभूमि के लोगों को काम पर रखता है न्यूयॉर्क टाइम्स के अनुसार, अपनी तकनीक को बेहतर ढंग से विषयों की एक विस्तृत श्रृंखला को समझने में मदद करने के लिए।
दीपसेक के मजबूत मॉडल
दीपसेक ने नवंबर 2023 में अपने मॉडल-डीपसेक कोडर, डीपसेक एलएलएम और डीपसेक चैट के अपने पहले सेट का अनावरण किया। लेकिन यह पिछले वसंत तक नहीं था, जब स्टार्टअप ने अपने अगले-जीन डीपसेक-वी 2 को मॉडल के परिवार को जारी किया, कि एआई उद्योग ने नोटिस लेना शुरू कर दिया।
दीपसेक-वी 2, एक सामान्य-उद्देश्य पाठ- और छवि-एनालिजिंग सिस्टम, विभिन्न एआई बेंचमार्क में अच्छा प्रदर्शन किया-और उस समय तुलनीय मॉडल की तुलना में चलाने के लिए बहुत सस्ता था। इसने डीपसेक की घरेलू प्रतिस्पर्धा को अपने कुछ मॉडलों के लिए उपयोग की कीमतों में कटौती करने और दूसरों को पूरी तरह से मुक्त करने के लिए, बाईडेंस और अलीबाबा सहित, को मजबूर किया।
दीपसेक-वी 3दिसंबर 2024 में लॉन्च किया गया, केवल डीपसेक की कुख्याति में जोड़ा गया।
दीपसेक के आंतरिक बेंचमार्क परीक्षण के अनुसार, डीपसेक वी 3 दोनों डाउनलोड करने योग्य, खुले तौर पर उपलब्ध मॉडल जैसे मेटा के आउटपरफॉर्म्स लामा और “बंद” मॉडल जो केवल एक एपीआई के माध्यम से एक्सेस किए जा सकते हैं, जैसे कि ओपनईआई GPT-4O।
समान रूप से प्रभावशाली डीपसेक का आर 1 “रीज़निंग” मॉडल है। जनवरी में जारी, डीपसेक का दावा है R1 प्रमुख बेंचमार्क पर Openai के O1 मॉडल के साथ -साथ प्रदर्शन करता है।
एक तर्क मॉडल होने के नाते, R1 प्रभावी रूप से तथ्य-जाँच करता है, जो इसे कुछ नुकसान से बचने में मदद करता है जो सामान्य रूप से मॉडल की यात्रा करते हैं। रीजनिंग मॉडल थोड़ा अधिक समय लेते हैं-आमतौर पर कुछ मिनटों तक लंबे समय तक-एक विशिष्ट गैर-रेनिंग मॉडल की तुलना में समाधान पर पहुंचने के लिए। उल्टा यह है कि वे भौतिकी, विज्ञान और गणित जैसे डोमेन में अधिक विश्वसनीय होते हैं।
हालांकि, R1, DeepSeek V3, और DeePseek के अन्य मॉडलों के लिए एक नकारात्मक पहलू है। चीनी-विकसित एआई होने के नाते, वे अधीन हैं बेंच मार्किंग चीन के इंटरनेट नियामक द्वारा यह सुनिश्चित करने के लिए कि इसकी प्रतिक्रियाएं “कोर समाजवादी मूल्यों को मूर्त रूप देती हैं।” उदाहरण के लिए, डीपसेक के चैटबॉट ऐप में, आर 1 तियानमेन स्क्वायर या ताइवान की स्वायत्तता के बारे में सवालों के जवाब नहीं देगा।
एक विघटनकारी दृष्टिकोण
यदि दीपसेक के पास एक व्यवसाय मॉडल है, तो यह स्पष्ट नहीं है कि वह मॉडल क्या है, बिल्कुल। कंपनी अपने उत्पादों और सेवाओं की कीमतों में अच्छी तरह से बाजार मूल्य से कम है – और दूसरों को मुफ्त में देती है। यह निवेशक के पैसे भी नहीं ले रहा हैवीसी ब्याज के एक टन के बावजूद।
जिस तरह से दीपसेक इसे बताता है, दक्षता सफलताओं ने इसे अत्यधिक लागत प्रतिस्पर्धा बनाए रखने में सक्षम बनाया है। कुछ विशेषज्ञ विवाद हालांकि कंपनी ने जो आंकड़े आपूर्ति की हैं।
जो भी मामला हो, डेवलपर्स ने डीपसेक के मॉडल में ले जाया है, जो खुले स्रोत नहीं हैं क्योंकि वाक्यांश आमतौर पर समझा जाता है, लेकिन अनुमेय लाइसेंस के तहत उपलब्ध हैं जो वाणिज्यिक उपयोग के लिए अनुमति देते हैं। क्लेम डेलंग्यू के अनुसार, गले लगाने वाले चेहरे के सीईओ, डीपसेक के मॉडल की मेजबानी करने वाले प्लेटफार्मों में से एक, हगिंग फेस पर डेवलपर्स ने आर 1 के 500 से अधिक “व्युत्पन्न” मॉडल बनाए हैं इसने 2.5 मिलियन डाउनलोड किए हैं।
बड़े और अधिक स्थापित प्रतिद्वंद्वियों के खिलाफ दीपसेक की सफलता रही है “एआई” के रूप में वर्णित है और “ओवर-हाइप्ड।” कंपनी की सफलता कम से कम भाग के लिए जिम्मेदार थी NVIDIA के शेयर की कीमत 18% तक कम हो गई जनवरी में, और के लिए एक सार्वजनिक प्रतिक्रिया प्राप्त करना Openai के सीईओ सैम अल्टमैन से।
माइक्रोसॉफ्ट घोषणा की कि डीपसेक अपनी एज़्योर एआई फाउंड्री सेवा पर उपलब्ध हैMicrosoft का मंच जो एक बैनर के तहत उद्यमों के लिए AI सेवाओं को एक साथ लाता है। सीईओ मार्क जुकरबर्ग ने कहा एआई इन्फ्रास्ट्रक्चर पर खर्च एक “रणनीतिक लाभ” जारी रहेगा मेटा के लिए। मार्च में, Openai ने दीपसेक को “राज्य-सब्सिडी” और “राज्य-नियंत्रित,” कहा, और अनुशंसा करता है कि अमेरिकी सरकार दीपसेक से मॉडल पर प्रतिबंध लगाने पर विचार करती है।
NVIDIA की चौथी तिमाही की कमाई कॉल के दौरान, सीईओ जेन्सेन हुआंग ने दीपसेक के “उत्कृष्ट नवाचार” पर जोर दिया, यह कहते हुए कि यह और अन्य “तर्क” मॉडल NVIDIA के लिए महान हैं क्योंकि उन्हें बहुत अधिक गणना की आवश्यकता है।
एक ही समय पर, कुछ कंपनियां दीपसेक पर प्रतिबंध लगा रही हैंऔर इसलिए पूरे हैं देशों और सरकारों, दक्षिण कोरिया सहित। न्यूयॉर्क राज्य भी सरकारी उपकरणों पर इस्तेमाल किए जाने से दीपसेक पर प्रतिबंध लगा दिया।
दीपसेक का भविष्य क्या हो सकता है, यह स्पष्ट नहीं है। बेहतर मॉडल एक दिए गए हैं। लेकिन अमेरिकी सरकार प्रतीत होती है यह हानिकारक विदेशी प्रभाव के रूप में क्या मानता है, इसकी सावधानी बरती। मार्च में, वॉल स्ट्रीट जर्नल ने बताया कि अमेरिका की संभावना सरकारी उपकरणों पर दीपसेक पर प्रतिबंध लगाएगी।
यह कहानी मूल रूप से 28 जनवरी, 2025 को प्रकाशित की गई थी, और इसे नियमित रूप से अपडेट किया जाएगा।