paint-brush
एआई के वे दिन चले गएद्वारा@aibites
1,594 रीडिंग
1,594 रीडिंग

एआई के वे दिन चले गए

द्वारा Shrinivasan Sankar5m2024/07/13
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

पिछले एक दशक में AI वाकई बहुत विकसित हुआ है - एक शिशु से एक जानवर तक। यहाँ मैं संक्षेप में बताता हूँ कि क्या बदल गया है
featured image - एआई के वे दिन चले गए
Shrinivasan Sankar HackerNoon profile picture

इस सप्ताह, मैं अपने सामान्य लेखों से थोड़ा हटकर AI अवधारणाओं या कोडिंग ट्यूटोरियल्स को समझा रहा हूँ। हाँ, यह एक दार्शनिक, उदासीन यात्रा है जिस पर मैं हमेशा चलने का सौभाग्य पाया।


किसी क्षेत्र में बहुत जल्दी शुरुआत करने का एक दुर्लभ विशेषाधिकार यह है कि आप उस क्षेत्र को अपने बच्चे की तरह बढ़ते हुए देखते हैं। जब मैंने एक दशक पहले कंप्यूटर विज़न में मास्टर्स की पढ़ाई शुरू की थी, तो मेरे एक सीएस स्नातक मित्र ने पूछा था, "कंप्यूटर विज़न का क्या मतलब है?" आज यह एक मामूली सवाल है क्योंकि सेगमेंटेशन (नीचे देखें) जैसे कंप्यूटर विज़न कार्यों के पर्याप्त वीडियो इंटरनेट पर घूम रहे हैं।

छवि विभाजन का परिणाम - एक कंप्यूटर विज़न कार्य जो एक दशक पहले जब गहन शिक्षण शुरू हुआ था, तब पूरे इंटरनेट पर छाया हुआ था।

तो, पिछले दशक में क्या बदलाव आया है? सिक्के के हमेशा दो पहलू होते हैं। साथ ही, विकास अच्छा और बुरा दोनों हो सकता है।

बंद समुदाय — छोटा ही सुंदर था

वे कहते हैं कि आइसलैंड में लोग किसी न किसी तरह से एक-दूसरे से संबंधित हैं और यदि कोई आपके दूसरे चचेरे भाई से परे है, तो आप उससे शादी कर सकते हैं।


इसी तरह, एआई समुदाय भी एक दूसरे से जुड़ा हुआ था। अब एक दूसरे से जुड़े हुए समुदाय की भावनाएँ खत्म हो गई हैं। शोध से जुड़े किसी व्यक्ति से बातचीत करते समय आप आम तौर पर जानते थे कि वे किस समूह से संबंधित हैं। आप किसी तरह उनके काम से जुड़ते और उनका सम्मान करते थे क्योंकि आप पढ़ते और क्षेत्र पर उनके प्रभाव की सराहना करते थे।


जैसे-जैसे यह क्षेत्र अंतहीन रूप से आगे बढ़ रहा है, यह कहना भी मुश्किल होता जा रहा है कि आप किसी के काम को जानते हैं, उनके बारे में तो भूल ही जाइए। इतने सारे नए नाम और नई शाखाएँ हैं कि उन पर नज़र रखना भी चुनौतीपूर्ण है।


एक अन्य उदाहरण के रूप में, PyTorch अपनी प्रारंभिक अवस्था में था। Slack समुदाय इतना छोटा और मददगार था कि PyTorch के डेवलपर्स ने लाइब्रेरी के उपयोग के बारे में हमारे सवालों का सीधे जवाब दिया। इससे इसके बारे में अधिक से अधिक सीखने को प्रोत्साहन मिला। आज, फ्रेमवर्क इतना परिपक्व हो चुका है, और LangChain और Llamaindex जैसे नए फ्रेमवर्क सामने आए हैं। AI की किसी भी अन्य शाखा की तुलना में LLM पर पूरा ध्यान दिया जाता है।

हार्डवेयर विलासिता

उन दिनों, हम कुछ प्रभावशाली बनाने के लिए एक ही GPU पर डीप न्यूरल नेटवर्क को प्रशिक्षित करते थे। CVPR, NeurIPS और ICML जैसे प्रमुख सम्मेलनों में प्रकाशित अधिकांश कार्य एक ही 8 GB GPU मशीन पर प्रशिक्षित और दोहराया जा सकता है या सबसे खराब स्थिति में, दुर्लभ मामलों में 4 GPU वाली एक ही मशीन पर।

टेस्ला द्वारा AI के लिए उपयोग किए गए नवीनतम GPU क्लस्टर की एक छवि (स्रोत: https://www.hpcwire.com/off-the-wire/tesla-to-roll-out-advanced-supercomputer )


मुझे अच्छी तरह याद है कि मैं कागल प्रतियोगिताओं में भाग लेने के लिए सिर्फ़ 8 जीबी रैम वाला एक कमोडिटी जीपीयू खरीदकर कितना खुश था। कागल ग्रैंडमास्टर्स के कुछ विजयी समाधानों ने घर पर एक ही जीपीयू मशीन पर डीप लर्निंग मॉडल को प्रशिक्षित किया।


आज की AI दुनिया को आधारभूत मॉडलों को प्रशिक्षित करने के लिए GPU क्लस्टर की आवश्यकता है। इन मॉडलों को ठीक करने के लिए भी 24GB GPU की आवश्यकता होती है जो बहुत ज़्यादा महंगे हैं और केवल "AI बजट" वाले व्यवसायों के लिए ही वहनीय हैं।

कौशल की मांग

वे दिन थे जब इस क्षेत्र को अभी तक एआई के आवरण में नहीं ढाला गया था। भर्तीकर्ताओं को "डीप लर्निंग" इंजीनियरों की तलाश करने का यह अजीब काम दिया गया था। भर्तीकर्ता और स्टार्ट-अप संस्थापक सभी चैनलों के माध्यम से डीप लर्निंग विशेषज्ञों की तलाश कर रहे थे। लिंक्डइन पर नियमित रूप से संदेश प्राप्त करना एक सामान्य बात थी जिसमें मुझे डीप लर्निंग इंजीनियर के रूप में उनकी टीम में शामिल होने के लिए कहा जाता था।

मशीन लर्निंग इंजीनियर के लिए नौकरी के विज्ञापन का स्क्रीनशॉट, जिसे केवल 5 दिन पहले पोस्ट किया गया था, जिसमें 100 से अधिक आवेदक आए थे!


वर्तमान स्थिति यह है कि "मशीन लर्निंग इंजीनियर" के पद के लिए विज्ञापन के एक दिन के भीतर ही लिंक्डइन पर 100 से अधिक आवेदन आ गए हैं। अगर आपको यकीन करना मुश्किल लग रहा है तो ऊपर दिए गए स्क्रीनशॉट को देखें। सवाल यह है कि आवेदक के कौशल नौकरी की विशिष्टता के लिए कितने प्रासंगिक हैं। लेकिन बाजार कौशल से भर गया है - बहुत जल्दी!

उप-कौशल - संचालन और वास्तुकला

विकास का मतलब है अधिक विविधता और अवसर। एमएल-ऑप्स, एलएलएम-ऑप्स और एमएल-आर्किटेक्ट्स जैसी नई भूमिकाएँ उभर रही हैं। छोटी, एकल-मॉडल फ़ाइलों (< 1 जीबी) के वे दिन चले गए हैं। आकार और क्षमताओं दोनों में मॉडलों के विकास ने उन्हें तैनात करने और बनाए रखने में नए कौशल को जन्म दिया है।


इसके अलावा, मॉडल का प्रशिक्षण और परिनियोजन MLFLow जैसे उपकरणों के साथ स्वचालित किया जा रहा है। प्रशिक्षण के लिए क्लाउड इंफ्रास्ट्रक्चर को पर्याप्त रूप से परिष्कृत होना चाहिए। इन सबने समर्पित जिम्मेदारियों के साथ पूर्णकालिक भूमिकाओं को जन्म दिया है।

अलविदा एमएल इंजीनियर, नमस्ते एआई इंजीनियर

AI में काम करने में सबसे मजेदार बात मॉडल आर्किटेक्चर लिखना और हमारे इन-हाउस डेटा का उपयोग करके मॉडल को स्क्रैच से प्रशिक्षित करना है। हालाँकि इसमें डेटा को बहुत पहले से प्रोसेस करना शामिल है, मॉडल को प्रशिक्षित करना और प्रशिक्षण परिणामों को विज़ुअलाइज़ करना बहुत मजेदार हुआ करता था। इसके लिए मशीन लर्निंग (ML) इंजीनियर नामक एक विशेष भूमिका थी/अभी भी है।


तकनीकी दिग्गजों द्वारा फाउंडेशन मॉडल का विकास इस भूमिका को पुनः परिभाषित कर रहा है। जैसे-जैसे मॉडल का आकार बढ़ता है, प्रशिक्षण बजट बहुत बड़ा होता जाता है। वास्तव में, मेटा के लिए LLama 2 मॉडल के प्रशिक्षण की लागत $20m थी। स्पष्ट रूप से स्टार्ट-अप या AI को अपनाने की कोशिश करने वाले संगठन इस राशि को बर्बाद नहीं करना चाहते हैं। अब यह स्थापित हो चुका है कि फाउंडेशन मॉडल तकनीकी दिग्गजों द्वारा विकसित किए जाने हैं, मिस्ट्रल और एंथ्रोपिक जैसी कुछ कंपनियों को छोड़कर।


दुख की बात है कि इसका मतलब है कि एमएल इंजीनियर की भूमिका एआई इंजीनियर की भूमिका में बदल रही है। एमएल इंजीनियर की भूमिका मॉडल आर्किटेक्चर विकसित करने, उन्हें प्रशिक्षित करने और उनका मूल्यांकन करने के बारे में थी। नई एआई इंजीनियर भूमिका में ज़्यादातर एपीआई विकसित करना या टेक दिग्गजों (ओपनएआई, मेटा और गूगल) द्वारा प्रदान किए गए एपीआई को लागू करना शामिल है ताकि फाउंडेशन मॉडल को प्रेरित किया जा सके।


दुर्लभ मामलों में, इसमें इन आधार मॉडल को ठीक करना शामिल है। लेकिन कंपनियों के पास RAG पाइपलाइन बनाने या उन्हें ठीक करने के बजाय आधार मॉडल को “जैसा है” इस्तेमाल करने का विकल्प होता है।

निष्कर्ष

निष्कर्ष के तौर पर, मैं इसे सॉफ्टवेयर इंजीनियरिंग और मशीन लर्निंग भूमिकाओं के धीमे समामेलन के रूप में देखता हूं। सॉफ्टवेयर इंजीनियरों और डीप लर्निंग विशेषज्ञों के बीच की रेखा फीकी पड़ रही है। इसलिए, आने वाले वर्षों में, सॉफ्टवेयर इंजीनियर एआई इंजीनियर होंगे जो कोड लिखने और ग्राहकों की जरूरतों को हल करने के लिए फाउंडेशन मॉडल के साथ काम करेंगे।


इसके अलावा, आने वाले वर्षों में, कंपनियों को दो श्रेणियों में बांटा जाएगा - एआई उत्पाद और एआई सेवा कंपनियां। एआई उत्पाद कंपनियां फिर से ओपनएआई, मेटा और गूगल होंगी जो आधारभूत मॉडल विकसित करेंगी। एआई सेवा कंपनियां अपने ग्राहकों की सेवा के लिए एआई आधारभूत मॉडल के इर्द-गिर्द आरएजी-शैली की पाइपलाइनों को ठीक करके या विकसित करके एपीआई सेवाएं प्रदान करेंगी।


अंत में, क्या नौकरी के लिए आवेदनों में उछाल डॉट कॉम बुलबुले की तरह बुलबुले के फटने का संकेत है? मुझे ऐसा लगता है, हाँ। लेकिन चलिए इंतज़ार करते हैं और देखते हैं…

चिल्लाओ

आशा है कि यह उपयोगी था.


अगर आपको यह लेख पसंद आया तो मुझे फॉलो क्यों न करें ट्विटर अनुसंधान अपडेट, वीडियो ट्यूटोरियल लिंक और शीर्ष एआई प्रयोगशालाओं से नए एआई टूल के लिए?


इसके अलावा, कृपया मेरी सदस्यता लें यूट्यूब चैनल जहां मैं एआई अवधारणाओं और शोधपत्रों को दृश्यात्मक रूप से समझाता हूं।