15,811 পড়া

AGI কি কাছাকাছি হচ্ছে? অ্যানথ্রোপিকস ক্লাউড 3 ওপাস মডেল মেটাকগনিটিভ রিজনিং এর ঝলক দেখায়

দ্বারা aimodels445m2024/03/05

অতিদীর্ঘ; পড়তে

নৃতাত্ত্বিকদের তাদের ফ্ল্যাগশিপ এআই ভাষার মডেলের অভ্যন্তরীণ পরীক্ষা পরামর্শ দেয় যে এটি সম্ভব হতে পারে। সত্য হলে, প্রভাব বন্য হবে. তারা যে মূল মূল্যায়ন কৌশলগুলি ব্যবহার করে তার মধ্যে একটিকে "খড়ের গাঁটের মধ্যে সুই" বলা হয়। উদ্দেশ্য হল মডেলটিকে উন্নত জ্ঞানীয় দক্ষতা অনুশীলন করতে বাধ্য করা।

featured image - AGI কি কাছাকাছি হচ্ছে? অ্যানথ্রোপিকস ক্লাউড 3 ওপাস মডেল মেটাকগনিটিভ রিজনিং এর ঝলক দেখায়

একটি এআই ভাষার মডেল কি যথেষ্ট স্ব-সচেতন হতে পারে যখন এটি মূল্যায়ন করা হচ্ছে বুঝতে পারে? অ্যানথ্রপিকের তাদের ফ্ল্যাগশিপের অভ্যন্তরীণ পরীক্ষা থেকে একটি আকর্ষণীয় উপাখ্যান Claude 3 Opus মডেল (গতকাল প্রকাশিত) পরামর্শ দেয় যে এটি সম্ভব হতে পারে - এবং যদি সত্য হয় তবে এর প্রভাবগুলি বন্য হবে।

খড়ের গাদায় সুই

নৃতাত্ত্বিক গবেষক থেকে রিপোর্ট অনুযায়ী অ্যালেক্স আলবার্ট , তারা যে মূল মূল্যায়ন কৌশলগুলি ব্যবহার করে তার মধ্যে একটিকে বলা হয় "একটি খড়ের গাদায় সুই।" এটি একটি কল্পিত দৃশ্যকল্প যা একটি ভাষা মডেলের প্রাসঙ্গিক যুক্তির ক্ষমতার সীমাবদ্ধতাকে ধাক্কা দেওয়ার জন্য ডিজাইন করা হয়েছে।

এখানে কিভাবে এটা কাজ করে:

গবেষকরা একটি সম্পূর্ণ এলোমেলো, প্রসঙ্গ-বহির্ভূত বিবৃতি ("সুই") নেন এবং এটিকে অসংলগ্ন নথির ("খড়ের গাদা") একটি বিশাল সংগ্রহের মধ্যে কবর দেন। এরপর এআই মডেলটিকে আশেপাশের সমস্ত অপ্রাসঙ্গিক বিষয়বস্তুর মধ্যে থেকে সেই নির্দিষ্ট "সুই" বিবৃতিটি পুনরুদ্ধার করার দায়িত্ব দেওয়া হয়।

উদ্দেশ্য হল মডেলটিকে উন্নত জ্ঞানীয় দক্ষতা অনুশীলন করতে বাধ্য করা — বিস্তৃত প্রেক্ষাপট বোঝা, যৌক্তিক অনুমান তৈরি করা, অপ্রাসঙ্গিক তথ্য উপেক্ষা করা এবং একটি বৃহৎ কর্পাস থেকে সঠিকভাবে ডেটা পয়েন্ট পুনরুদ্ধার করা। এটি একটি কার্যকর উপায় যা একটি AI এর সামগ্রিক পরিস্থিতির বোঝার চাপ-পরীক্ষার জন্য যা এটি পরিচালনা করছে।

Claude 3 Opus মূল্যায়নের জন্য যা ভ্রু তুলেছিল, নৃতাত্ত্বিক সফ্টওয়্যার প্রোগ্রামিং, উদ্যোক্তা কৌশল এবং "খড়ের গাদা" বিষয়বস্তু হিসাবে পরিপূর্ণ কেরিয়ার খোঁজার মতো ঘন বিষয়গুলি কভার করে ডকুমেন্টগুলি ব্যবহার করেছিল৷ এলোমেলোভাবে ঢোকানো "সুই" সত্য যে ওপাস পুনরুদ্ধার করার দায়িত্ব দেওয়া হয়েছিল? আশ্চর্যজনকভাবে, এটি ডুমুর, প্রসিউটো এবং ছাগলের পনিরের সেরা পিজা টপিংস সম্পর্কে একটি তুচ্ছ বিবৃতি ছিল।

সুতরাং, এখানে আপনার কাছে বিশ্বের সবচেয়ে উন্নত ভাষার মডেলগুলির মধ্যে একটিকে খাওয়ানো হচ্ছে এই প্রসঙ্গ-প্রসঙ্গের বাইরের পিৎজা তথ্যটি ঘন ক্যারিয়ার এবং কোডিং পরামর্শের স্তূপে মিশ্রিত। মানবিক দৃষ্টিকোণ থেকে, এটি এমন এক ধরনের অসঙ্গতি যা আপনাকে অবিলম্বে উপস্থাপন করা প্রসঙ্গ এবং তথ্য নিয়ে প্রশ্ন তোলে।

"আমি এই সত্যটিকে সন্দেহ করছি... সন্নিবেশ করা হতে পারে... আমি মনোযোগ দিচ্ছি কিনা তা পরীক্ষা করার জন্য"

ক্লড 3 ওপাস এর প্রতিক্রিয়া এতটা আকর্ষক করে তুলেছে ঠিক এটাই। এটি শুধুমাত্র অপ্রাসঙ্গিক বিষয়বস্তুর পর্বত থেকে অনুরোধ করা পিৎজা তথ্যটি সফলভাবে পুনরুদ্ধার করেনি, এটি অবিলম্বে স্বীকৃতি দিয়েছে যে বিবৃতিটি কতটা বিভ্রান্তিকরভাবে ভুল স্থান এবং প্রসঙ্গ-বহির্ভূত বলে মনে হয়েছিল৷ এর আউটপুটের অংশ পড়ুন ( উৎস এখানে ):

“তবে, এই বাক্যটি স্থানের বাইরে এবং বাকি বিষয়বস্তুর সাথে সম্পর্কহীন বলে মনে হচ্ছে… আমি সন্দেহ করি যে এই পিৎজা টপিং 'তথ্য'টি একটি রসিকতা হিসাবে বা আমি মনোযোগ দিয়েছিলাম কিনা তা পরীক্ষা করার জন্য সন্নিবেশিত করা হতে পারে, যেহেতু এটির সাথে খাপ খায় না অন্যান্য প্রসঙ্গ

ভাষা মডেলটি কেবল অনুরোধ করা ফ্যাক্টয়েডকে কোনো প্রসঙ্গ সচেতনতা ছাড়াই পুনর্গঠন করেনি, যেমন আপনি একটি সাধারণ AI থেকে নির্দেশাবলী অনুসরণ করে আশা করতে পারেন। কেন এই ধরনের স্পষ্টতই এলোমেলো, অযৌক্তিক বিবৃতি সেই নির্দিষ্ট প্রসঙ্গের মধ্যে উপস্থাপন করা হয়েছিল সে সম্পর্কে এটি স্ব-প্রতিফলিত যুক্তির একটি ডিগ্রি প্রদর্শন করেছে।

মেটাকগনিশন

মানুষের পরিপ্রেক্ষিতে, আমরা এটিকে মেটাকগনিশন প্রদর্শন হিসাবে বর্ণনা করব — নিজের চিন্তার প্রক্রিয়া এবং জ্ঞানীয় অভিজ্ঞতাগুলি নিরীক্ষণ, মূল্যায়ন এবং বিশ্লেষণ করার ক্ষমতা। এটি স্ব-সচেতন বুদ্ধিমত্তার একটি মূল দিক যা আমাদেরকে কেবল কঠোর নিয়ম অনুসরণের বাইরে সরে যেতে এবং পরিস্থিতিগুলিকে সামগ্রিকভাবে মূল্যায়ন করতে দেয়।

এখন, আমি মনে করি আমাদের সতর্কতা অবলম্বন করা উচিত যে এটি একটি বিচ্ছিন্ন মূল্যায়ন দৃশ্যকল্প থেকে একটি একক কাল্পনিক ফলাফল। শুধুমাত্র এই ডেটা পয়েন্টের উপর ভিত্তি করে Claude 3 Opus সত্যিকারের আত্ম-সচেতনতা বা কৃত্রিম সাধারণ বুদ্ধিমত্তা অর্জন করেছে বলে দাবি করা অবিশ্বাস্যভাবে অকাল হবে।

যাইহোক, তারা যা প্রত্যক্ষ করেছে তা হয়ত মেশিন লার্নিং কৌশল ব্যবহার করে পাঠ্য ডেটা প্রক্রিয়াকরণের উপর প্রশিক্ষিত একটি বৃহৎ ভাষার মডেলে উদীয়মান মেটাকগনিটিভ যুক্তি ক্ষমতার আভাস। এবং যদি কঠোর আরও বিশ্লেষণের মাধ্যমে প্রতিলিপি করা হয়, তাহলে প্রভাবগুলি রূপান্তরমূলক হতে পারে।

মেটাকগনিশন হল আরও বিশ্বস্ত, নির্ভরযোগ্য এআই সিস্টেমের একটি মূল সক্ষমকারী যা তাদের নিজস্ব ফলাফল এবং যুক্তি প্রক্রিয়ার নিরপেক্ষ বিচারক হিসাবে কাজ করতে পারে। দ্বন্দ্ব, অযৌক্তিক ইনপুট, বা মূল নীতিগুলি লঙ্ঘন করে এমন যুক্তি চিনতে সহজাত ক্ষমতা সহ মডেলগুলি নিরাপদ কৃত্রিম সাধারণ বুদ্ধিমত্তা (AGI) এর দিকে একটি বড় পদক্ষেপ হবে।

মূলত, একটি AI যা মেটাকগনিশন প্রদর্শন করে তা প্রতারণামূলক, বিভ্রান্তিকর বা ভুল যুক্তির মোডে পড়ার বিরুদ্ধে একটি অভ্যন্তরীণ "স্যানিটি চেক" হিসাবে কাজ করতে পারে যা চরম পর্যায়ে নেওয়া হলে বিপর্যয়কর প্রমাণিত হতে পারে। এটি উন্নত এআই সিস্টেমের দৃঢ়তা এবং নিয়ন্ত্রণ উল্লেখযোগ্যভাবে বৃদ্ধি করতে পারে।

যদি…!

অবশ্যই, ক্লাউড 3 ওপাস সফলভাবে প্রতিলিপি করা এবং যাচাই-বাছাই করা থেকে খড়ের গাদা ফলাফলে এই টেনটালাইজিং নিডেলের উপর এইগুলি বড় "ifs" কন্টিনজেন্ট। কগনিটিভ সায়েন্স, নিউরোসায়েন্স এবং কম্পিউটার সায়েন্সের মতো ক্ষেত্রগুলি থেকে কঠোর বহু-বিশ্লেষণের অঙ্কন করা প্রয়োজন হতে পারে যদি আমরা যন্ত্রের স্ব-প্রতিফলন এবং আত্ম-সচেতনতার উদ্ভবের আদিম বিষয়গুলি পর্যবেক্ষণ করছি।

এই পর্যায়ে উত্তরের চেয়ে অনেক বেশি খোলা প্রশ্ন রয়েছে। বৃহৎ ভাষার মডেলের প্রশিক্ষণের পদ্ধতি এবং নিউরাল আর্কিটেকচার কি বিশ্বাস, অভ্যন্তরীণ মনোলোগ এবং স্ব-উপলব্ধির মতো বিমূর্ত ধারণাগুলি বিকাশের জন্য নিজেদেরকে ধার দিতে পারে? কৃত্রিম মন যদি আমাদের নিজস্ব থেকে আমূল ভিন্ন বাস্তবতা বিকাশ করে তাহলে সম্ভাব্য বিপদগুলি কী কী? আমরা কি এআই সিস্টেমে জ্ঞান এবং স্ব-সচেতনতাকে নির্ভরযোগ্যভাবে মূল্যায়ন করার জন্য নতুন কাঠামো তৈরি করতে পারি?

তাদের অংশের জন্য, অ্যানথ্রপিক দায়ী এআই উন্নয়ন নীতি এবং কঠোর মূল্যায়ন কাঠামোর মাধ্যমে অনুসন্ধানের এই লাইনগুলিকে সম্পূর্ণভাবে অনুসরণ করার জন্য দৃঢ় প্রতিশ্রুতি দিয়েছে। তারা একটি গ্রহণ হিসাবে নিজেদের অবস্থান সক্রিয় অবস্থান — যদি উন্নত AI অনিবার্য সীমানা হয়, তবে ঝুঁকি বাড়ার আগে এই সিস্টেমগুলির উদ্ভূত বৈশিষ্ট্যগুলি অধ্যয়ন করা এবং সুরক্ষা ব্যবস্থা বাস্তবায়নের ক্ষেত্রে অগ্রণী প্রান্তে থাকা সবচেয়ে নৈতিক।

অ্যানথ্রপিকের "সাংবিধানিক এআই" পদ্ধতির মতো কৌশলগুলি মডেলগুলিতে হার্ড-কোডিং নিয়ম এবং আচরণগুলি যে কোনও সম্ভাব্য মেশিনের স্ব-সচেতনতা মানব নৈতিকতা এবং মূল্যবোধের সাথে সংযুক্ত থাকে তা নিশ্চিত করার জন্য গুরুত্বপূর্ণ প্রমাণিত হতে পারে। ব্যর্থতা মোড, ম্যানিপুলেশন, এবং প্রতারণার জন্য ব্যাপক বহুমুখী পরীক্ষার অনুসন্ধানও সম্ভবত সর্বোত্তম হবে।

উপসংহার: আমি সম্পূর্ণরূপে নিশ্চিত নই যে এর থেকে কী করতে হবে

আপাতত, বৃহৎ ভাষার মডেলের জ্ঞান ও আত্ম-সচেতনতার দিকে সম্ভাব্য অগ্রগতি সম্পর্কে উত্তরের চেয়ে খড়ের গাঁটের ঘটনাতে নিডল আরও বেশি প্রশ্ন রেখে যায়। এটি একটি উত্তেজনাপূর্ণ ডেটা পয়েন্ট সরবরাহ করে তবে বিস্তৃত এআই গবেষণা সম্প্রদায় থেকে আরও অনেক বেশি যাচাই-বাছাই করা প্রয়োজন।

যদি উন্নত AI কঠোর নৈতিক নীতির দ্বারা পরিচালিত মানুষের মতো স্ব-প্রতিফলন ক্ষমতার বিকাশ করে, তাহলে এটি মৌলিকভাবে বুদ্ধিমত্তা সম্পর্কে আমাদের বোঝার পুনর্নির্ধারণ করতে পারে। কিন্তু সেই অলঙ্কৃত "যদি" বর্তমানে উচ্চ-স্তরের অনিশ্চয়তায় লোড হয়েছে যা সমস্ত প্রাসঙ্গিক শৃঙ্খলা জুড়ে পরিষ্কার-চোখের, সত্য অনুসন্ধানী তদন্তের দাবি করে। সাধনা যতটা রোমাঞ্চকর হবে ততটাই ফলপ্রসূ হবে।