दीपसेक के नए चैटबोट में एक प्रभावशाली परिचय है: "हाय, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक जवाब प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सके।" यह एआई, चीनी स्टार्टअप दीपसेक का एक उत्पाद, जल्दी से एक प्रमुख खिलाड़ी बन गया है, यहां तक कि एनवीडिया के स्टॉक मूल्य में महत्वपूर्ण गिरावट का कारण भी।

दीपसेक की सफलता अपने अभिनव वास्तुकला और प्रशिक्षण विधियों से उपजी है। प्रमुख प्रौद्योगिकियों में शामिल हैं:
- मल्टी-टोकन भविष्यवाणी (एमटीपी): एक-एक करके शब्दों की भविष्यवाणी करने के बजाय, एमटीपी एक साथ कई शब्दों का अनुमान लगाता है, सटीकता और दक्षता को बढ़ाता है।
- विशेषज्ञों का मिश्रण (एमओई): यह आर्किटेक्चर डीपसेक वी 3 में 256 तंत्रिका नेटवर्क का उपयोग करता है, प्रत्येक टोकन प्रसंस्करण कार्य के लिए आठ को सक्रिय करता है, प्रशिक्षण को काफी तेज करता है और प्रदर्शन में सुधार करता है।
- मल्टी-हेड लेटेंट ध्यान (एमएलए): एमएलए बार-बार पाठ के टुकड़ों से महत्वपूर्ण विवरण निकालता है, यह सुनिश्चित करता है कि महत्वपूर्ण जानकारी याद नहीं है, जिससे इनपुट डेटा की अधिक बारीक समझ हो जाती है।

जबकि डीपसेक ने शुरू में 2048 जीपीयू का उपयोग करते हुए डीपसेक वी 3 के लिए $ 6 मिलियन की उल्लेखनीय रूप से कम प्रशिक्षण लागत का दावा किया था, सेमियालिसिस ने कहीं अधिक पर्याप्त बुनियादी ढांचे का खुलासा किया: लगभग 50,000 एनवीडिया हॉपर जीपीयू (10,000 एच 800, 10,000 एच 100 और अतिरिक्त एच 20 एस सहित)। यह लगभग $ 1.6 बिलियन के कुल सर्वर निवेश का प्रतिनिधित्व करता है, जिसमें परिचालन खर्च $ 944 मिलियन का अनुमान है।
चाइनीज हेज फंड हाई-फ्लायर की सहायक कंपनी दीपसेक अपने डेटा सेंटरों का मालिक है, जो अनुकूलन और नवाचार कार्यान्वयन पर अद्वितीय नियंत्रण प्रदान करता है। यह स्व-वित्त पोषित दृष्टिकोण लचीलापन और निर्णय लेने की गति को बढ़ाता है। इसके अलावा, कंपनी शीर्ष प्रतिभा को आकर्षित करती है, कुछ शोधकर्ताओं ने सालाना 1.3 मिलियन डॉलर से अधिक की कमाई की, मुख्य रूप से प्रमुख चीनी विश्वविद्यालयों से भर्ती किया।

दीपसेक का $ 6 मिलियन प्रशिक्षण लागत का दावा भ्रामक है; यह केवल पूर्व-प्रशिक्षण GPU उपयोग को दर्शाता है, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को छोड़कर। एआई विकास में कंपनी का वास्तविक निवेश $ 500 मिलियन से अधिक है। हालांकि, इसकी दुबला संरचना बड़े, अधिक नौकरशाही संगठनों की तुलना में कुशल नवाचार कार्यान्वयन के लिए अनुमति देती है।

दीपसेक की कहानी एक अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनी की दिग्गजों के साथ प्रतिस्पर्धा करने की क्षमता को प्रदर्शित करती है। इसकी सफलता, हालांकि, निवेश, तकनीकी सफलताओं और एक मजबूत टीम में अरबों से जुड़ी हुई है। "क्रांतिकारी बजट" कथा एक महत्वपूर्ण निरीक्षण है। फिर भी, दीपसेक की लागत प्रतियोगियों की तुलना में काफी कम है। उदाहरण के लिए, दीपसेक ने R1 पर $ 5 मिलियन खर्च किए, जबकि CHATGPT4 की लागत $ 100 मिलियन है।