सुनिये सब लोग!
यदि एआई सोने की दौड़ में है, तो एनवीडिया सर्वश्रेष्ठ कंपनी है। एआई की सभी चीजें एनवीडिया के माध्यम से होती हैं क्योंकि यह एकमात्र कंपनी है जो कम्प्यूटेशनल रूप से महंगे बड़े भाषा मॉडल को तैनात करने के लिए आवश्यक चिप्स (जीपीयू) बनाती है। जैसे-जैसे मॉडल बड़े होते हैं, अधिक शक्तिशाली जीपीयू की आवश्यकता बढ़ जाती है और पूरी दुनिया उन्हें वितरित करने के लिए एनवीडिया पर भरोसा कर रही है। यह कहना अतिशयोक्ति नहीं होगी कि एनवीडिया एआई की सभी चीजों के मूल में है और उन्होंने हाल ही में अपना अर्ध-वार्षिक डेवलपर सम्मेलन जीटीसी (18-21 मार्च) आयोजित किया था। इस पोस्ट में मैं इस विशेष जीटीसी सम्मेलन से अपने मुख्य निष्कर्षों का सारांश देने जा रहा हूं और जनरल एआई स्पेस के लिए इसका क्या अर्थ है।
जनरल एआई क्या कर सकता है और क्या प्रदान कर सकता है, इसकी शक्ति गैर-तकनीकी क्षेत्रों में खत्म नहीं हुई है। अर्थव्यवस्था के सभी क्षेत्रों की कंपनियां सोचती हैं कि उन्हें एआई को अपनाने और साझेदारी, क्रियान्वयन और आगे रहने का रास्ता खोजने की जरूरत है। यहां प्रमाण यह देख रहा है कि कितनी गैर-तकनीकी क्षेत्र की कंपनियों ने एनवीडिया के साथ साझेदारी की है। खुदरा, ऑटोमोबाइल, निर्माण, डिज़ाइन और अन्य सभी कंपनियों ने एनवीडिया के साथ साझेदारी की घोषणा की है।
जब से ट्रांसफार्मर का आविष्कार हुआ है, हम हर 6 महीने में एलएलएम के पैमाने को दोगुना कर रहे हैं। उदाहरण के लिए, नीचे ओपन एआई मॉडल की पैरामीटर संख्या देखें।
अकेले GPT-3 श्रृंखला में पैरामीटर गिनती 125M से 175B तक थी। और ओपन एआई से आने वाले नवीनतम मॉडलों के बारे में अफवाह है कि पैरामीटर संख्या ट्रिलियन से ऊपर है और यदि स्केलिंग की दर जारी रहती है तो जल्द ही दो साल से भी कम समय में ट्रिलियन तक पहुंच सकती है। एलएलएम के बढ़ते पैमाने का समर्थन करने के लिए हमें बढ़ी हुई कम्प्यूटेशनल शक्ति की आवश्यकता है। बाजार पर कब्जा करने के लिए, एनवीडिया ब्लैकवेल नामक जीपीयू की एक नई श्रृंखला लॉन्च कर रहा है, जिसका नाम सांख्यिकीविद् और गणितज्ञ डेविड ब्लैकवेल के नाम पर रखा गया है। ब्लैकवेल GPU (GB200) की एक नई श्रृंखला है, लेकिन एक नया सुपर कंप्यूटर प्लेटफ़ॉर्म भी है।
यहां नई ब्लैकवेल जीपीयू की पिछली पीढ़ी के जीपीयू हॉपर के साथ प्रदर्शन की तुलना की गई है।
कंप्यूटिंग की वर्तमान पीढ़ी में, सब कुछ विभिन्न प्रारूपों में संग्रहीत डेटा के एक टुकड़े को पुनर्प्राप्त करने और इसे इस तरह से प्रस्तुत करने के बारे में है जो उपयोगकर्ता के लिए उपयोगी है। लेकिन कंप्यूटिंग और ऐप्स की आने वाली पीढ़ी में, हम उपयोगकर्ता के अनुरोध पर चीज़ें तैयार करने और उसे उपयोगकर्ता को वापस देने के बारे में और अधिक देखने वाले हैं। उदाहरण के लिए चैट-जीपीटी के मामले में, आपको जो उत्तर मिल रहा है वह पहले से किसी डेटाबेस में संग्रहीत नहीं है, बल्कि उपयोगकर्ता के प्रश्न को पूरा करने के लिए वास्तविक समय में उत्पन्न किया जा रहा है। हम पाठ, चित्र, वीडियो, रसायन, प्रोटीन और बहुत कुछ की पीढ़ी देखने वाले हैं।
अनुमान लगाना तब होता है जब आप चैट-जीपीटी से कोई प्रश्न पूछते हैं, मॉडल टोकन जनरेशन के रूप में उत्तर का पता लगाता है और टोकन के रूप में उत्तर लौटाता है। यदि अनुमान पर्याप्त तेज़ नहीं है, तो उपभोक्ता किसी भी एआई एप्लिकेशन का उपयोग नहीं कर पाएंगे। अनुमान विशेष रूप से मुश्किल है क्योंकि एलएलएम बड़े और बड़े होते जा रहे हैं और वे एक जीपीयू में फिट नहीं होते हैं, इसलिए जीपीयू में अनुमान को समानांतर करना एक कठिन काम है और इसमें कई अनुकूलन तकनीकों का उपयोग करने के लिए एनवीडिया जीपीयू प्रोग्रामिंग शामिल है। ब्लैकवेल जीपीयू के साथ, एनवीडिया 30 गुना तेज अनुमान गति प्राप्त करने में सक्षम है।
जैसे-जैसे मैंने एनवीडिया द्वारा ओम्निवर्स के बारे में अधिक से अधिक सीखा, मैं उत्पाद और विचार पर अधिक से अधिक आशावादी हो गया। ऐसा इसलिए है क्योंकि वास्तव में एआई का लाभ उठाने और स्वचालन और रोबोटिक्स में सभी संभावनाओं को अनलॉक करने के लिए, हमारे पास वास्तव में आवश्यक सभी डेटा नहीं है। उदाहरण के लिए, मान लें कि आप एक ऐसा रोबोट बनाना चाहते हैं जो हर तरह का बढ़िया खाना पकाए। ऐसा कोई डेटा नहीं है जहां आपको विभिन्न प्रकार के व्यंजन पकाने वाले रसोइयों के बारे में प्रत्यक्ष जानकारी मिले। हमारे पास YouTube वीडियो के रूप में विभिन्न खाना पकाने का सामान्य डेटा है, लेकिन रोबोटों को खाना पकाने में शामिल शारीरिक गतिविधियों को सीखने के लिए पहले व्यक्ति डेटा की आवश्यकता होती है। ओमनिवर्स में दुनिया का 3डी सिमुलेशन इन सभी उपयोग मामलों को अनलॉक करने के लिए आवश्यक डेटा के अंतर को पाटने में मदद कर सकता है। मैं इस विचार को लेकर बेहद आशावान हूं।
एआई के 100 दिनों में से 22वें दिन के लिए इतना ही।
मैं एबव एवरेज नाम से एक समाचार पत्र लिखता हूं जहां मैं बड़ी तकनीक में होने वाली हर चीज के पीछे दूसरे क्रम की अंतर्दृष्टि के बारे में बात करता हूं। यदि आप टेक में हैं और औसत नहीं बनना चाहते हैं, तो इसकी सदस्यता लें ।
एआई के 100 दिनों पर नवीनतम अपडेट के लिए मुझे ट्विटर , लिंक्डइन या हैकरनून पर फॉलो करें या इस पेज को बुकमार्क करें । यदि आप टेक में हैं तो आपको यहां मेरे तकनीकी पेशेवरों के समुदाय में शामिल होने में रुचि हो सकती है।