এই প্রবন্ধটি সুপার ভিশন স্টুডিওর টিম শিয়া-এর সাথে যৌথভাবে লেখা হয়েছে।
এখন পর্যন্ত, জেনারেটিভ এআই-এর সবচেয়ে আকর্ষণীয় ব্যবহারের ক্ষেত্রে মানব কর্মীদের প্রতিস্থাপন করা বা কঠোরভাবে সংজ্ঞায়িত কর্মপ্রবাহ স্বয়ংক্রিয় করা নয়, বরং সিদ্ধান্ত নেওয়ার সময় লোকেরা যে মাত্রাগুলি অন্বেষণ করতে পারে তা ব্যাপকভাবে বৃদ্ধি করা। এইভাবে, এলএলএম এবং ডিফিউশন মডেলগুলি অবিশ্বাস্য মস্তিষ্কপ্রবণ অংশীদার। আমরা এলএলএম-দের যে জ্ঞানের ক্ষেত্রটি উপস্থাপন করতে চাই সে সম্পর্কে নির্দেশ দিতে পারি এবং তারপরে আমরা কীভাবে আউটপুট দেখতে চাই তা সুনির্দিষ্টভাবে সংজ্ঞায়িত করতে পারি। উদাহরণস্বরূপ, আমরা জিজ্ঞাসা করতে পারি:
"আমি VF কর্পোরেশন, নিউ গার্ড গ্রুপ, অনলি দ্য ব্রেভ এবং LVMH এর মতো বিলাসবহুল খুচরা হোল্ডিং কোম্পানিগুলির একটি ডাটাবেস তৈরি করতে চাই, সেইসাথে তারা সম্প্রতি যে ব্র্যান্ডগুলি অধিগ্রহণ করেছে। আপনি কি অনুগ্রহ করে নিম্নলিখিত কলামগুলি সহ একটি এক্সেল স্প্রেডশিট তৈরি করতে পারেন: হোল্ডিং কোম্পানি, ব্র্যান্ডের নাম, অধিগ্রহণের পরিমাণ, অধিগ্রহণের তারিখ, অধিগ্রহণের যুক্তি"
এই ধরণের প্রশ্নগুলিকে এখন টেবিল স্টেক হিসেবে বিবেচনা করা হয়, যা জেনারেটিভ এআই-এর যুগে প্রচলিত সার্চ ইঞ্জিনগুলির তুলনায় একটি আশ্চর্যজনক আপগ্রেড।
তবে, কিছু সিদ্ধান্ত প্রক্রিয়া অত্যন্ত জটিল হতে পারে। কখনও কখনও আমরা একাধিক বিশেষায়িত ব্যক্তি (যেমন একজন CEO, CMO, অথবা CTO) অথবা বিশেষায়িত মডিউল (যেমন একটি API সংযোগকারী, K1 পার্সার, অথবা SWOT বিশ্লেষক) এর মধ্যে সংঘটিত সিদ্ধান্ত গ্রহণের মডেল তৈরি করতে সক্ষম হতে চাই। বাস্তব জগতে, আমরা সেই এক্সেল স্প্রেডশিটের ফলাফল নেব এবং মানব বিশেষজ্ঞদের একটি দল দ্বারা এটি পরিচালনা করব। কৌশলবিদ, বিনিয়োগকারী এবং ডোমেন বিশেষজ্ঞরা এতে যোগ দেবেন। আমরা অধিগ্রহণ সম্পর্কে "কী হলে" তৈরি করব, আমরা P&Ls খনন করব এবং সম্ভাব্য ভবিষ্যতের অধিগ্রহণের জন্য আমরা বাজারে যাওয়ার পরিকল্পনার স্বপ্ন দেখব। কিন্তু আধুনিক LLM-এর জন্য ধন্যবাদ, আমরা এখন ব্যক্তিগতকৃত AI এজেন্ট তৈরি করতে পারি যারা এই প্রতিটি আচরণের মডেল তৈরি করতে পারে এবং আমাদের সিদ্ধান্তগুলি অবহিতকারী বিশেষজ্ঞদের একটি কক্ষের অনুকরণ করতে পারে।
তাই যখন আমরা প্রথম সুপার ভিশন স্টুডিও প্রতিষ্ঠা করি - একটি এআই-অ্যাক্সিলারেটেড ভেঞ্চার স্টুডিও যা "ফিউচার ব্র্যান্ড" তৈরির উপর দৃষ্টি নিবদ্ধ করে - আমরা অবিলম্বে মাল্টি-এজেন্ট এআই সিস্টেমের দিকে ঝুঁকে পড়ি মালিকানাধীন সিদ্ধান্ত গ্রহণ প্রক্রিয়াগুলিকে মডেল করার জন্য যাকে আমরা আমাদের "সুপার ভিশন ওএস" বলি। এর সাহায্যে, আমরা দুর্বল পিএন্ডএল মডেলগুলির সন্ধানে বিশাল ব্যবসায়িক ডাটাবেসগুলি অনুসন্ধান করতে পারি যেখানে এআই অসাধারণ উন্নতি করতে পারে। আমরা আমাদের ওএসে এজেন্টদের খুচরা, সিপিজি, প্রিন্ট, বিনোদন, বা ই-কমার্স সম্পর্কে অনুমানমূলক ধারণা দিতে পারি। এজেন্টরা সংখ্যাগুলি ক্র্যাঞ্চ করতে পারে, পোন্টিফিকেট করতে পারে এবং একে অপরের সাথে বিতর্ক করতে পারে। এজেন্টরা এমন কিছু তৈরি করতে পারে যা অন্যান্য এজেন্টরা সমালোচনা করে এবং পুনরাবৃত্তি করে।
সাধারণ LLM চ্যাট ইন্টারফেসের তুলনায় মাল্টি-এজেন্ট সিস্টেমের অনেক সুবিধা রয়েছে: সিস্টেমের প্রতিটি এজেন্টকে প্রচুর পরিমাণে বিশেষ জ্ঞান দিয়ে প্রশিক্ষিত করা যেতে পারে।
অটোজেন, ক্রুএআই এবং ল্যাংচেইনের মতো কাস্টমাইজড মাল্টি-এজেন্ট সিস্টেমগুলি দাঁড় করানোর জন্য আমাদের কাছে অফ-দ্য-শেল্ফ বিকল্পগুলির একটি বিশাল অ্যারে রয়েছে। আমরা অটোজেন বেছে নিয়েছি কারণ এটি বিনামূল্যে, প্রচুর পরিচিতিমূলক ভিডিও রয়েছে এবং তারা একাধিক ভিন্ন মাল্টি-এজেন্ট আর্কিটেকচারের জন্য নমুনা কোড সরবরাহ করে যা একসাথে কনফিগার এবং স্ট্যাক করা যেতে পারে। অটোজেন "কথোপকথন প্যাটার্ন" (যেমন টু-এজেন্ট চ্যাট, সিক্যুয়েন্সিয়াল চ্যাট, গ্রুপ চ্যাট এবং নেস্টেড চ্যাট) নামক উদাহরণগুলির একটি বিস্তৃত তালিকা তালিকাভুক্ত করে।
এই প্যাটার্নগুলি, বা স্থাপত্যগুলি, এজেন্ট সিস্টেমের নকশা প্রক্রিয়ার একটি গুরুত্বপূর্ণ অংশ। এটি মানব বিশেষজ্ঞদের একটি দল তৈরি করার এবং তাদের মধ্যে সম্পৃক্ততার নিয়মগুলিকে পূর্বনির্ধারিত করার অনুরূপ। বিভিন্ন নকশা অত্যন্ত ভিন্ন ফলাফল তৈরি করতে পারে।
অটোজেন যে সহজতম প্যাটার্নটি প্রদান করে তা হল একটি দুই-এজেন্ট চ্যাট, যেখানে আমরা প্রতিটি এজেন্টের ব্যক্তিত্ব সংজ্ঞায়িত করি, যেখানে একজন এজেন্ট অন্য এজেন্টকে কেবল মূল প্রম্পট প্রশ্ন জিজ্ঞাসা করে এবং যেখানে এজেন্টরা একটি সমস্যা নিয়ে নির্দিষ্ট সংখ্যক বার এগিয়ে যায়। এটি সেট আপ করা সহজ, এবং আমরা তাদের কথোপকথনের মধ্যে প্রতিটি মিথস্ক্রিয়াকে অক্ষরে অক্ষরে পড়তে পারি। নমুনা কোডটি নীচে দেওয়া হল:
import os from autogen import ConversableAgent agent__venture_studio_founder = ConversableAgent ( name="Agent__Venture_Studio_Founder", system_message="You are the founder owner of a venture studio with expertise in funding and building technology and retail brands.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, ) agent__business_analyst = ConversableAgent ( name="Agent__Business_Analyst", system_message="You are an expert business analyst with deep expertise in finance, strategy, marketing, and operations.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, ) chat_result = agent__venture_studio_founder.initiate_chat ( agent__business_analyst, message="""I want to identify companies that traditionally have weak P&L's such as thin profit margins, fickle customers, or are high susceptibility to market swings. Our thesis is we want to focus on industries such as Retail, CPG, Print, Entertainment, and e-Commerce so we only want to look at types of companies in those specific industries. We want to choose company types where Generative AI can produce outsized efficiencies to the P&L's. Don't want to consider company types where Generative AI cannot help. """, summary_method="reflection_with_llm", max_turns=2, )
এই আউটপুটটি বেশ কার্যকর, এবং এটি আমাদের পরবর্তী করণীয় সম্পর্কে কিছু ধারণা দেয়। কিন্তু এটি ChatGPT-কে একই প্রশ্ন একটি প্রম্পটে জিজ্ঞাসা করার চেয়ে উল্লেখযোগ্যভাবে বেশি মূল্যবান নয়।
একটু বেশি উন্নত প্যাটার্ন হল সিকোয়েন্সিয়াল চ্যাট। এই ক্ষেত্রে, আমরা একাধিক টু-এজেন্ট চ্যাট সেট আপ করি, যেখানে প্রতিটি টু-এজেন্ট চ্যাটের আউটপুট একাধিক ডাউনস্ট্রিম টু-এজেন্ট চ্যাটে পাঠানো হয়। এই নকশাটিকে একজন সিইওর মতো ভাবুন যিনি একজন নিম্ন-স্তরের কর্মচারীর হাতে একটি কাজ অর্পণ করেন, যিনি সিদ্ধান্ত নেন এবং তারপর একাধিক স্তরের অনুমোদনের মাধ্যমে সিদ্ধান্তগুলি পাস করেন। এই নকশার নমুনা কোড নীচে দেওয়া হল।
# Define the Orchestrator agent__orchestrator = ConversableAgent( name="Agent__Orchestrator", system_message="You coordinate the analysis of an industry by passing tasks to other agents and summarizing their feedback.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the Brainstorm Agent agent__brainstorm_analyst = ConversableAgent( name="Agent__Brainstorm_Analyst", system_message="You analyze the given industry and generate a list of company types with weak P&L models where AI can deliver substantial improvements. Return this list.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CFO agent__cfo = ConversableAgent( name="Agent__CFO", system_message="You criticize the provided list of company types from a financial POV, identifying weaknesses in margins, capex, opex, inventory, and liquidity. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CTO agent__cto = ConversableAgent( name="Agent__CTO", system_message="You criticize the provided list of company types from a technology POV, identifying risks in tech implementation, cost, complexity, and feasibility. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CMO agent__cmo = ConversableAgent( name="Agent__CMO", system_message="You criticize the provided list of company types from a marketing POV, identifying risks in go-to-market, media costs, and customer acquisition and retention. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", )
এই প্যাটার্নটি এখন বিশেষজ্ঞদের একটি দল দ্বারা যাচাই করা হয়েছে, যা উল্লেখযোগ্যভাবে আরও স্পষ্ট এবং বিস্তারিত প্রতিক্রিয়া তৈরি করে। এবং এটি সঠিক কাজের জন্য সঠিক এজেন্ট সিস্টেম ডিজাইনের গুরুত্বের উপর জোর দেয়।
অটোজেন গ্রুপ চ্যাট এবং নেস্টেড চ্যাট সহ বিভিন্ন ধরণের ডিজাইন প্যাটার্নের উদাহরণ প্রদান করে, তবে ক্ষেত্রটি অবিশ্বাস্যভাবে নতুন, এবং সম্ভাব্য ডিজাইন এবং আর্কিটেকচার সীমাহীন। আমরা প্রস্তাবনা এবং শ্বেতপত্রগুলি দেখেছি:\
এটি একটি আকর্ষণীয় ক্ষেত্র এবং আমরা সুপার ভিশন স্টুডিওতে আমাদের সিদ্ধান্ত গ্রহণ এবং পরিচালনা ক্ষমতায় রকেট জ্বালানি সরবরাহ করার জন্য নতুন কাঠামো এবং নকশার ধরণগুলি নিয়ে সক্রিয়ভাবে পরীক্ষা-নিরীক্ষা করছি। যদি এটি আপনার জন্য একটি আকর্ষণীয় ক্ষেত্র হয়, তাহলে দয়া করে আমাদের সাথে যোগাযোগ করুন, আমরা এই ক্ষেত্রের অন্যান্য স্মার্ট অনুশীলনকারীদের সাথে যুক্ত হতে আগ্রহী।
সুপার ভিশন স্টুডিও সম্পর্কে
সুপার ভিশন হল একটি এআই-চালিত ভেঞ্চার স্টুডিও যা "ভবিষ্যতের ব্র্যান্ড" তৈরিতে মনোনিবেশ করে।
আরও তথ্যের জন্য, অনুগ্রহ করে দেখুন