यदि आप चैटजीपीटी के लगातार उपयोगकर्ता हैं, तो आप जानते हैं कि इसके भटकने की प्रवृत्ति को मतिभ्रम के रूप में जाना जाता है। सांख्यिकीय रूप से सही शब्दों का एक बड़ा संग्रह जिसका वास्तविकता में कोई आधार नहीं है। कुछ महीने पहले, बड़े भाषा मॉडल (एलएलएम) और लैंगचैन के लिए अपाचे कैसेंड्रा का उपयोग करने के बारे में एक जिज्ञासु प्रतिक्रिया हुई। ChatGPT ने बताया कि एलएलएम बनाते समय न केवल कैसेंड्रा एक अच्छा उपकरण विकल्प था, OpenAI ने कैसेंड्रा का उपयोग MIT-लाइसेंस प्राप्त पायथन लाइब्रेरी के साथ किया जिसे उन्होंने CassIO कहा।
खरगोश के छेद में हम गए, और अधिक उत्साह के माध्यम से, चैटजीपीटी ने कैसियो का उपयोग करने के तरीके के बारे में कई विवरणों का वर्णन किया। इसमें कुछ नमूना कोड और एक वेबसाइट भी शामिल थी। बाद के शोध में चैटजीपीटी प्रतिक्रियाओं के बाहर कैसियो का कोई सबूत नहीं मिला, लेकिन बीज बोया गया था। यदि यह पुस्तकालय मौजूद नहीं था, तो इसकी आवश्यकता थी और हमने शीघ्र ही इस पर काम करना शुरू कर दिया।
सबसे अच्छा मतिभ्रम।
क्या असली कैसियो कृपया खड़ा होगा?
यह महान विचार क्या था जिससे ChatGPT (और, एसोसिएशन द्वारा, OpenAI) प्रेरित हुआ? एक महान पायथन पुस्तकालय डेवलपर्स को कम से अधिक करने में सक्षम बनाता है। डेटास्टैक्स और अनंत ने विकास में संयुक्त बल दिया
कैसियो की ताकत विशिष्ट एआई ढांचे के प्रति इसके अज्ञेयवाद में निहित है। यह इंटरफेस के विशिष्ट कार्यान्वयन विवरण के साथ खुद को चिंतित नहीं करता है
लैंगचैन के साथ एकीकरण
एलएलएम के लिए एक मेमोरी मॉड्यूल जो स्टोरेज के लिए कैसेंड्रा का उपयोग करता है, जो चैट इंटरेक्शन में हाल के एक्सचेंजों को याद रख सकता है, या यहां तक कि पूरी पिछली बातचीत का सारांश भी रख सकता है।
कैसेंड्रा पर एलएलएम प्रतिक्रियाओं को कैश करने की सुविधा, जिससे जहां संभव हो विलंबता और टोकन की बचत होती है। कैसेंड्रा से डेटा का एक संकेत या लंबी एलएलएम बातचीत में स्वचालित इंजेक्शन।
भविष्य की आपूर्ति के लिए अनिर्दिष्ट कुछ इनपुट छोड़कर संकेतों के "आंशिककरण" के लिए समर्थन।
ए से डेटा का स्वचालित इंजेक्शन
दावत फीचर स्टोर (संभावितकैसेंड्रा द्वारा समर्थित ) एक संकेत में।
ये घटक डेटा को संकेतों में शामिल करने की प्रक्रिया को कारगर बनाने के लिए एक साथ काम करते हैं और एलएलएम और डेटाबेस के बीच सहज संपर्क सुनिश्चित करते हैं।
वेक्टर खोज के साथ एकीकरण
का समावेश
- एलएलएम प्रतिक्रियाओं का कैश जो किसी क्वेरी के सटीक वाक्यांश पर निर्भर नहीं हैं।
- एक "सिमेंटिक इंडेक्स" जो ज्ञान के आधार को संग्रहीत कर सकता है और किसी दिए गए प्रश्न का सर्वोत्तम उत्तर बनाने के लिए प्रासंगिक भागों को पुनः प्राप्त कर सकता है। इस उपकरण को कई विशिष्ट आवश्यकताओं के अनुरूप अनुकूलित किया जा सकता है और उत्तर में बहने वाली वास्तविक जानकारी को अधिकतम करने के लिए विविध जानकारी प्राप्त करने के लिए कॉन्फ़िगर किया जा सकता है।
- एलएलएम चैट इंटरैक्शन के लिए एक "सिमेंटिक मेमोरी" तत्व, जो दूर के अतीत में होने पर भी प्रासंगिक पिछले एक्सचेंजों को पुनः प्राप्त कर सकता है।
CassIO और LangChain का संयोजन एलएलएम प्रबंधन की निरंतर विकसित होने वाली जरूरतों को पूरा करने के लिए समय के साथ इन क्षमताओं का विस्तार और परिशोधन जारी रखता है। वर्तमान अत्याधुनिक एलएलएम से अधिक सटीक प्रतिक्रिया प्राप्त करने के लिए श्रृंखलाबद्ध संकेतों में है। हाल ही के एक पेपर में एक तकनीक का वर्णन किया गया है
अगला संकेत: कैसियो के लिए आगे क्या है
एक विकासशील उपकरण के रूप में, कैसियो तेजी से बढ़ रहा है, जिसमें नए विकास और अपडेट अक्सर जोड़े जाते हैं। लेखन के समय, Cassio LangChain का समर्थन करता है, LlamaIndex जल्द ही आ रहा है। इस परियोजना का दीर्घकालिक लक्ष्य स्वायत्त एआई एजेंटों जैसे
एक आगामी बूट शिविर, "
कौन जानता है कि इतिहास इस पल का न्याय कैसे करेगा? क्या यह OpenAI की आंतरिक जानकारी का रिसाव था? या, थोड़ा और गहराई से सोचते हुए, क्या यह एआई का पहला कदम है जिससे मनुष्य अपनी बोली लगा सकते हैं? किसी भी तरह से, डेवलपर्स के पास अब कैसेंड्रा के निकट-अनंत पैमाने पर टैप करने के लिए एक सरल-से-उपयोग वाली लाइब्रेरी है, जब जनरेटिव एआई की दुनिया में हड़ताली हो रही है।
चैटजीपीटी ने हमें एक तोहफा दिया है, तो आप इससे क्या बनाने जा रहे हैं? मैं आगामी वेबिनार में सदिश खोज में गोता लगाने जा रहा हूं (register
पैट्रिक मैकफैडिन, डेटास्टैक्स द्वारा
पैट्रिक मैकफैडिन ओ'रेली की किताब 'मैनेजिंग क्लाउड नेटिव डेटा ऑन कुबेरनेट्स' के सह-लेखक हैं। वह वर्तमान में डेवलपर संबंधों में डेटास्टैक्स में और अपाचे कैसेंड्रा परियोजना में योगदानकर्ता के रूप में काम करता है। पैट्रिक ने अपाचे कैसेंड्रा के लिए मुख्य इंजीलवादी के रूप में काम किया है (वह एक नवनिर्मित कैसेंड्रा कमिटर भी है!) और डेटास्टैक्स के सलाहकार के रूप में, जहां उनके पास उत्पादन में कुछ सबसे बड़ी तैनाती का निर्माण करने का एक अच्छा समय था।