আপনি যদি ChatGPT-এর ঘনঘন ব্যবহারকারী হন, তাহলে আপনি জানেন যে এটিকে হ্যালুসিনেশন বলে অভিহিত করার প্রবণতা রয়েছে। পরিসংখ্যানগতভাবে সঠিক শব্দের একটি দুর্দান্ত সংগ্রহ যার বাস্তবে কোন ভিত্তি নেই। কয়েক মাস আগে, বড় ভাষা মডেল (এলএলএম) এবং ল্যাংচেইনের জন্য অ্যাপাচি ক্যাসান্দ্রা ব্যবহার করার বিষয়ে একটি প্রম্পট একটি কৌতূহলী প্রতিক্রিয়ার ফলে। ChatGPT রিপোর্ট করেছে যে এলএলএম তৈরি করার সময় কেবল ক্যাসান্দ্রা একটি ভাল টুল পছন্দ ছিল না, ওপেনএআই একটি এমআইটি-লাইসেন্সপ্রাপ্ত পাইথন লাইব্রেরির সাথে ক্যাসান্দ্রাকে ব্যবহার করেছিল যাকে তারা CassIO বলে।
খরগোশের গর্তে আমরা গিয়েছিলাম, এবং আরও প্রম্পটিংয়ের মাধ্যমে, ChatGPT CassIO কীভাবে ব্যবহার করা হয়েছিল সে সম্পর্কে অনেক বিবরণ বর্ণনা করেছে। এটি এমনকি কিছু নমুনা কোড এবং একটি ওয়েবসাইট অন্তর্ভুক্ত করেছে। পরবর্তী গবেষণায় ChatGPT প্রতিক্রিয়ার বাইরে CassIO-এর কোনো প্রমাণ পাওয়া যায়নি, তবে বীজ বপন করা হয়েছিল। যদি এই লাইব্রেরিটি বিদ্যমান না থাকে, তবে এটির প্রয়োজন ছিল এবং আমরা কিছুক্ষণ পরেই এটিতে কাজ শুরু করেছি।
সর্বকালের সেরা হ্যালুসিনেশন।
আসল ক্যাসিও কি দয়া করে দাঁড়াবে?
এই দুর্দান্ত ধারণাটি কী ছিল যা ChatGPT (এবং, সমিতি দ্বারা, OpenAI) অনুপ্রাণিত করেছিল? একটি দুর্দান্ত পাইথন লাইব্রেরি ডেভেলপারদের কম দিয়ে আরও কিছু করতে সক্ষম করে। DataStax এবং Anant সম্মিলিত শক্তি উন্নয়নশীল
CassIO এর শক্তি নির্দিষ্ট AI কাঠামোর প্রতি তার অজ্ঞেয়বাদের মধ্যে নিহিত। এটি ইন্টারফেসের মতো নির্দিষ্ট বাস্তবায়নের বিবরণের সাথে নিজেকে উদ্বিগ্ন করে না
ল্যাংচেইনের সাথে একীকরণ
LLM-এর জন্য একটি মেমরি মডিউল যা স্টোরেজের জন্য ক্যাসান্দ্রা ব্যবহার করে, যা একটি চ্যাট ইন্টারঅ্যাকশনে সাম্প্রতিক এক্সচেঞ্জগুলি মনে রাখতে পারে, বা এমনকি পুরো অতীত কথোপকথনের সারাংশও রাখতে পারে।
ক্যাসান্ড্রাতে এলএলএম প্রতিক্রিয়াগুলি ক্যাশ করার একটি বৈশিষ্ট্য, যার ফলে যেখানে সম্ভব লেটেন্সি এবং টোকেনগুলি সংরক্ষণ করা হয়৷ ক্যাসান্দ্রা থেকে একটি প্রম্পটে বা একটি দীর্ঘ এলএলএম কথোপকথনের মধ্যে স্বয়ংক্রিয়ভাবে ডেটা ইনজেকশন৷
ভবিষ্যতে সরবরাহের জন্য কিছু ইনপুট অনির্দিষ্ট রেখে প্রম্পটগুলির "আংশিককরণ" এর জন্য সমর্থন।
একটি থেকে তথ্য স্বয়ংক্রিয় ইনজেকশন
পরব বৈশিষ্ট্য দোকান (সম্ভাব্যভাবেক্যাসান্দ্রা দ্বারা সমর্থিত ) একটি প্রম্পটে।
এই উপাদানগুলি প্রম্পটে ডেটা অন্তর্ভুক্ত করার প্রক্রিয়াটিকে প্রবাহিত করতে এবং এলএলএম এবং ডাটাবেসের মধ্যে মসৃণ মিথস্ক্রিয়া নিশ্চিত করতে একসাথে কাজ করে।
ভেক্টর অনুসন্ধানের সাথে ইন্টিগ্রেশন
এর অন্তর্ভুক্তি
- LLM প্রতিক্রিয়াগুলির একটি ক্যাশে যা একটি প্রশ্নের সঠিক বাক্যাংশের উপর নির্ভরশীল নয়।
- একটি "অর্থসূচক সূচক" যা একটি জ্ঞানের ভিত্তি সঞ্চয় করতে পারে এবং একটি প্রদত্ত প্রশ্নের সর্বোত্তম উত্তর তৈরি করতে প্রাসঙ্গিক অংশগুলি পুনরুদ্ধার করতে পারে। এই টুলটি অনেক নির্দিষ্ট প্রয়োজন অনুসারে মানিয়ে নেওয়া যেতে পারে এবং উত্তরে প্রবাহিত প্রকৃত তথ্যকে সর্বাধিক করার জন্য বিভিন্ন তথ্য পুনরুদ্ধার করার জন্য কনফিগার করা যেতে পারে।
- LLM চ্যাট ইন্টারঅ্যাকশনের জন্য একটি "অর্থবোধক মেমরি" উপাদান, যা প্রাসঙ্গিক অতীত এক্সচেঞ্জ পুনরুদ্ধার করতে পারে এমনকি যদি তারা দূর অতীতে ঘটে থাকে।
CassIO এবং LangChain-এর সংমিশ্রণ LLM ব্যবস্থাপনার ক্রমবর্ধমান চাহিদা মেটাতে সময়ের সাথে সাথে এই ক্ষমতাগুলিকে প্রসারিত ও পরিমার্জিত করে চলেছে। LLMs থেকে আরও সঠিক প্রতিক্রিয়া পেতে বর্তমান অত্যাধুনিক প্রম্পটগুলি চেইন করা হচ্ছে৷ সাম্প্রতিক একটি গবেষণাপত্রে বলা হয় একটি কৌশল বর্ণনা
পরবর্তী প্রম্পট: CassIO এর জন্য কি এগিয়ে আছে
একটি বিকশিত সরঞ্জাম হিসাবে, CassIO দ্রুত বৃদ্ধি পাচ্ছে, নতুন উন্নয়ন এবং আপডেটগুলি ঘন ঘন যোগ করা হচ্ছে। লেখার সময়, CassIO ল্যাংচেইনকে সমর্থন করে, সাথে LlamaIndex শীঘ্রই আসছে। এই প্রকল্পের দীর্ঘমেয়াদী লক্ষ্য হল স্বায়ত্তশাসিত AI এজেন্টগুলির জন্য উচ্চ-স্কেল মেমরিকে সমর্থন করা যেমন
একটি আসন্ন বুট ক্যাম্প, "
কে জানে এই মুহূর্তে ইতিহাস কীভাবে বিচার করবে? এটা কি OpenAI থেকে অভ্যন্তরীণ তথ্য ফাঁস ছিল? অথবা, একটু বেশি অন্ধকারে চিন্তা করে, এটি কি এআই-এর প্রথম পদক্ষেপ যা মানুষকে তার বিডিং করতে দেয়? যেভাবেই হোক, জেনারেটিভ এআই-এর জগতে প্রবেশ করার সময় ডেভেলপারদের কাছে এখন ক্যাসান্দ্রার কাছাকাছি-অসীম স্কেলে ট্যাপ করার জন্য একটি সহজ-ব্যবহারযোগ্য লাইব্রেরি রয়েছে।
ChatGPT আমাদের একটি উপহার দিয়েছে, তাহলে আপনি এটি দিয়ে কী তৈরি করতে যাচ্ছেন? আমি একটি আসন্ন ওয়েবিনারে ভেক্টর অনুসন্ধানে ডুব দিতে যাচ্ছি (রেজিস্টার
প্যাট্রিক ম্যাকফ্যাডিন, ডেটাস্ট্যাক্স দ্বারা
প্যাট্রিক ম্যাকফ্যাডিন হলেন ও'রিলি বইয়ের সহ-লেখক 'ম্যানেজিং ক্লাউড নেটিভ ডেটা অন কুবারনেটস।' তিনি বর্তমানে DataStax-এ ডেভেলপার সম্পর্ক এবং Apache Cassandra প্রকল্পে অবদানকারী হিসেবে কাজ করেন। প্যাট্রিক Apache Cassandra-এর জন্য প্রধান প্রচারক হিসেবে কাজ করেছেন (তিনি একজন সদ্য মিন্টেড ক্যাসান্দ্রা কমিটরও!) এবং DataStax-এর পরামর্শদাতা হিসেবে কাজ করেছেন, যেখানে তিনি উৎপাদনে সবচেয়ে বড় কিছু স্থাপনা তৈরি করতে দারুণ সময় কাটিয়েছেন।