Тази статия е написана съвместно с Тим Шей от Super Vision Studio.
Досега най-убедителният случай на използване на Generative AI не е замяната на човешки работници или автоматизирането на строго определени работни потоци, а по-скоро значително увеличаване на измеренията, които хората могат да изследват, когато вземат решение. По този начин LLM и дифузионните модели са невероятни партньори за мозъчна атака. Можем да инструктираме LLM за домейна на знанието, който бихме искали да представлява, и след това точно да дефинираме как бихме искали да видим изхода. Например, можем да попитаме:
„Искам да създам база данни на холдинговите компании за луксозни стоки на дребно като VF Corporation, New Guard Group, Only The Brave и LVMH, както и марките, които наскоро са придобили. Можете ли да генерирате електронна таблица в Excel със следните колони: Холдингова компания, Име на марката, Сума на придобиване, Дата на придобиване, Обосновка за придобиване"
Заявки като тази вече се считат за залози на масата, зашеметяващо надграждане в сравнение с традиционните търсачки, които сега изглеждат странни в ерата на Generative AI.
Някои процеси на вземане на решения обаче могат да бъдат изключително сложни. Понякога бихме искали да можем да моделираме вземането на решения, което може да възникне между множество специализирани лица (като главен изпълнителен директор, CMO или CTO) или специализирани модули (като API конектор, K1 парсер или SWOT анализатор). В реалния свят щяхме да вземем резултатите от тази електронна таблица на Excel и да я прокараме през ръкавица от човешки експерти. Стратези, инвеститори и експерти по домейни ще се включат. Ще конструираме „какво ако“ за придобиванията, ще се задълбочим в печалбите и загубите и ще измислим планове за излизане на пазара за потенциални бъдещи придобивания. Но благодарение на модерните LLM, сега можем да създадем индивидуализирани AI агенти, които могат да моделират всяко от тези поведения и да симулират наличието на стая, пълна с експерти, които информират нашите решения.
Мултиагентна операционна система Super Vision
Така че, когато за първи път основахме Super Vision Studio – ускорено с AI рисково студио, фокусирано върху създаването на „Бъдещи марки“ – веднага се обърнахме към мултиагентни AI системи, за да моделираме собствените процеси за вземане на решения, които наричаме нашата „Super Vision OS“. С него можем да претърсим огромни бизнес бази данни в търсене на слаби модели на печалби и загуби, където AI може да осигури огромни подобрения. Можем да натоварим агентите в нашата операционна система с хипотетични предложения относно търговията на дребно, CPG, печата, развлеченията или електронната търговия. Агентите могат да пресичат числа, да понтифицират и да дебатират помежду си. Агентите могат дори да произвеждат резултати, които други агенти критикуват и повтарят.
Системите с множество агенти имат редица предимства пред простите LLM чат интерфейси: Всеки агент в системата може да бъде обучен с огромно количество специализирани знания
- Агентите могат да бъдат проектирани така, че да се появят специфични видове връщане напред и назад и проверки и баланс.
- Агентите могат да бъдат свързани заедно с детерминистични модули - като скрипт на Python - които изпълняват специализирани задачи.
- На агентската система може да се даде почти безкрайно изчислително пространство, за да итерира и да предлага опции.
- Агентската система може да ни представи ослепителен набор от опции, всяка от които съдържа изключително добре изработени детайли.
Екосистемата на мултиагентната система
Разполагаме и с огромен набор от готови опции за изправяне на персонализирани мултиагентни системи като AutoGen, CrewAI и LangChain. Избрахме AutoGen, защото е безплатен, има тонове въвеждащи видеоклипове и те предоставят примерен код за множество различни мултиагентни архитектури, които могат да бъдат конфигурирани и подредени заедно. AutoGen каталогизира обширен списък от примери за това, което нарича „модели на разговор“ (като чат с два агента, последователен чат, групов чат и вложен чат).
Тези модели или архитектури са важна част от процеса на проектиране на агентната система. Подобно е на това как бихте изградили екип от човешки експерти и предварително определили правилата за взаимодействие между тях. Различните дизайни могат да доведат до изключително различни резултати.
Най-простият модел, който AutoGen предоставя, е чат с двама агенти, където ние дефинираме личността на всеки агент, където един агент просто задава на другия агент първоначалния подканващ въпрос и където агентите се връщат напред и назад по проблем определен брой пъти. Лесно е да се настрои и ние можем да прочетем всяко взаимодействие в рамките на техния разговор дословно. Примерният код е по-долу:
import os from autogen import ConversableAgent agent__venture_studio_founder = ConversableAgent ( name="Agent__Venture_Studio_Founder", system_message="You are the founder owner of a venture studio with expertise in funding and building technology and retail brands.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, ) agent__business_analyst = ConversableAgent ( name="Agent__Business_Analyst", system_message="You are an expert business analyst with deep expertise in finance, strategy, marketing, and operations.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, ) chat_result = agent__venture_studio_founder.initiate_chat ( agent__business_analyst, message="""I want to identify companies that traditionally have weak P&L's such as thin profit margins, fickle customers, or are high susceptibility to market swings. Our thesis is we want to focus on industries such as Retail, CPG, Print, Entertainment, and e-Commerce so we only want to look at types of companies in those specific industries. We want to choose company types where Generative AI can produce outsized efficiencies to the P&L's. Don't want to consider company types where Generative AI cannot help. """, summary_method="reflection_with_llm", max_turns=2, )
Резултатът е доста полезен и дава на нас хората някои идеи какво да правим по-нататък. Но това не е значително по-ценно от това просто да зададете същия въпрос на ChatGPT в една подкана.
Малко по-напреднал модел е последователен чат. В този случай ние настройваме множество чатове с два агента, където резултатът от всеки чат с два агента се предава на множество чатове с два агента надолу по веригата. Мислете за този дизайн като главен изпълнителен директор, който предава задача на служител от по-ниско ниво, който взема решения и след това прекарва решенията през множество нива на одобрение. Примерен код за този дизайн е по-долу.
# Define the Orchestrator agent__orchestrator = ConversableAgent( name="Agent__Orchestrator", system_message="You coordinate the analysis of an industry by passing tasks to other agents and summarizing their feedback.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the Brainstorm Agent agent__brainstorm_analyst = ConversableAgent( name="Agent__Brainstorm_Analyst", system_message="You analyze the given industry and generate a list of company types with weak P&L models where AI can deliver substantial improvements. Return this list.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CFO agent__cfo = ConversableAgent( name="Agent__CFO", system_message="You criticize the provided list of company types from a financial POV, identifying weaknesses in margins, capex, opex, inventory, and liquidity. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CTO agent__cto = ConversableAgent( name="Agent__CTO", system_message="You criticize the provided list of company types from a technology POV, identifying risks in tech implementation, cost, complexity, and feasibility. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CMO agent__cmo = ConversableAgent( name="Agent__CMO", system_message="You criticize the provided list of company types from a marketing POV, identifying risks in go-to-market, media costs, and customer acquisition and retention. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", )
Този модел създава значително по-остри и подробни отзиви сега, след като е проверен от цяла група експерти. И подчертава важността на проектирането на правилната агентна система за правилната задача.
AutoGen предоставя примери за много различни дизайнерски модели, включително групови чатове и вложени чатове, но полето е невероятно зараждащо се, а потенциалните дизайни и архитектури са неограничени. Разгледахме предложения и бели книги за:\
- Magentic-One: Multi-Agent System от Microsoft, където агенти, като „Web Surfer“ или „Coder“, работят заедно под ръководството на централен „Orchestrator“ за решаване на сложни задачи.
- Human Personas: Проект, свързан със Станфорд, при който агентите бяха обучени да се държат като субекти от реалния живот на качествени интервюта и след това помолени да разговарят и да вземат решения по различни теми.
- Проект Сид: широкомащабна симулация на „общества“ на агенти, където агентите едновременно участват в работни места, търговия, вземане на решения и развити социални системи, симулиращи човешки общности.
Това е завладяваща област и ние активно експериментираме с нови рамки и дизайнерски модели, за да осигурим ракетно гориво за нашите възможности за вземане на решения и оперативни възможности в Super Vision Studios. Ако това е интересна област за вас, моля, свържете се с нас, ще се радваме да се ангажираме с други умни практици в тази област.
Относно Super Vision Studio
Super Vision е студио, управлявано от AI, фокусирано върху изграждането на „Бъдещи марки“.
За повече информация, моля посетете