この記事は、Super Vision Studio の Tim Shea と共同執筆されました。
これまでのところ、ジェネレーティブ AI の最も魅力的な使用例は、人間の労働者を置き換えたり、厳密に定義されたワークフローを自動化したりすることではなく、意思決定の際に人々が探索できる次元を大幅に増やすことです。このように、LLM と拡散モデルは素晴らしいブレインストーミング パートナーです。LLM に表現したい知識領域を指示し、出力をどのように表示したいかを正確に定義できます。たとえば、次のように尋ねることができます。
「VF Corporation、New Guard Group、Only The Brave、LVMH などの高級小売持株会社と、これらの会社が最近買収したブランドのデータベースを作成したいと考えています。次の列を含む Excel スプレッドシートを生成してください: 持株会社、ブランド名、買収額、買収日、買収の理由」
このようなクエリは現在では必須とみなされており、生成 AI の時代では古風に思える従来の検索エンジンに比べて驚異的なアップグレードとなっています。
ただし、意思決定プロセスの中には、極めて複雑なものもあります。複数の専門のペルソナ (CEO、CMO、CTO など) や専門のモジュール (API コネクタ、K1 パーサー、SWOT アナライザーなど) の間で行われる意思決定をモデル化したい場合もあります。現実世界では、Excel スプレッドシートの結果を取得して、それを人間の専門家の厳しい審査にかけます。戦略家、投資家、ドメインの専門家が意見を述べます。買収について「もしも」を構築し、損益を詳しく調べ、将来の買収の可能性に対する市場開拓計画を練ります。しかし、現代の LLM のおかげで、これらの各動作をモデル化し、意思決定に役立つ専門家が大勢集まる状況をシミュレートできる個別の AI エージェントを作成できるようになりました。
そこで、私たちが最初にスーパービジョンスタジオ(「未来のブランド」の創造に重点を置く AI 加速型ベンチャースタジオ)を設立したとき、私たちはすぐにマルチエージェント AI システムに目を向け、独自の意思決定プロセスをモデル化しました。これを「スーパービジョン OS」と呼んでいます。これにより、AI が大幅な改善をもたらす可能性のある弱い P&L モデルを探すために、大規模なビジネスデータベースを徹底的に調べることができます。OS 内のエージェントに、小売、CPG、印刷、エンターテイメント、または e コマースに関する仮説を課すことができます。エージェントは数字を計算し、意見を述べ、互いに議論することができます。エージェントは、他のエージェントが批判して反復する成果物を作成することさえできます。
マルチエージェントシステムは、単純なLLMチャットインターフェースに比べて多くの利点があります。システム内の各エージェントは、膨大な専門知識でトレーニングすることができます。
また、AutoGen、CrewAI、LangChain など、カスタマイズされたマルチエージェント システムを立ち上げるための既製のオプションも多数用意されています。AutoGen を選んだのは、無料であること、紹介ビデオが多数あること、複数の異なるマルチエージェント アーキテクチャのサンプル コードが提供され、それらを構成してスタックできることが理由です。AutoGen は、いわゆる「会話パターン」の例 (2 エージェント チャット、シーケンシャル チャット、グループ チャット、ネストされたチャットなど) を広範囲にカタログ化しています。
これらのパターン、つまりアーキテクチャは、エージェント システムの設計プロセスの重要な部分です。これは、人間の専門家のチームを構築し、チーム間の交戦ルールを事前に定義する方法に似ています。異なる設計によって、まったく異なる結果が生じる可能性があります。
AutoGen が提供する最もシンプルなパターンは、2 エージェント チャットです。ここでは、各エージェントのペルソナを定義し、一方のエージェントがもう一方のエージェントに元のプロンプトの質問をするだけです。エージェントは、設定された回数だけ問題についてやり取りします。設定は簡単で、会話内の各やり取りを逐語的に読み取ることができます。サンプル コードは次のとおりです。
import os from autogen import ConversableAgent agent__venture_studio_founder = ConversableAgent ( name="Agent__Venture_Studio_Founder", system_message="You are the founder owner of a venture studio with expertise in funding and building technology and retail brands.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, ) agent__business_analyst = ConversableAgent ( name="Agent__Business_Analyst", system_message="You are an expert business analyst with deep expertise in finance, strategy, marketing, and operations.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, ) chat_result = agent__venture_studio_founder.initiate_chat ( agent__business_analyst, message="""I want to identify companies that traditionally have weak P&L's such as thin profit margins, fickle customers, or are high susceptibility to market swings. Our thesis is we want to focus on industries such as Retail, CPG, Print, Entertainment, and e-Commerce so we only want to look at types of companies in those specific industries. We want to choose company types where Generative AI can produce outsized efficiencies to the P&L's. Don't want to consider company types where Generative AI cannot help. """, summary_method="reflection_with_llm", max_turns=2, )
この出力は非常に有用で、人間に次に何をすべきかについてのアイデアを与えてくれます。しかし、ChatGPT に同じ質問を 1 つのプロンプトで尋ねるだけの場合と比べて、それほど価値があるわけではありません。
もう少し高度なパターンは、シーケンシャル チャットです。この場合、複数の 2 エージェント チャットを設定し、各 2 エージェント チャットの出力は複数の下流の 2 エージェント チャットに渡されます。この設計は、CEO が下位レベルの従業員にタスクを渡し、その従業員が決定を下し、その決定を複数の承認レベルに渡すようなものと考えてください。この設計のサンプル コードを以下に示します。
# Define the Orchestrator agent__orchestrator = ConversableAgent( name="Agent__Orchestrator", system_message="You coordinate the analysis of an industry by passing tasks to other agents and summarizing their feedback.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the Brainstorm Agent agent__brainstorm_analyst = ConversableAgent( name="Agent__Brainstorm_Analyst", system_message="You analyze the given industry and generate a list of company types with weak P&L models where AI can deliver substantial improvements. Return this list.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CFO agent__cfo = ConversableAgent( name="Agent__CFO", system_message="You criticize the provided list of company types from a financial POV, identifying weaknesses in margins, capex, opex, inventory, and liquidity. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CTO agent__cto = ConversableAgent( name="Agent__CTO", system_message="You criticize the provided list of company types from a technology POV, identifying risks in tech implementation, cost, complexity, and feasibility. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CMO agent__cmo = ConversableAgent( name="Agent__CMO", system_message="You criticize the provided list of company types from a marketing POV, identifying risks in go-to-market, media costs, and customer acquisition and retention. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", )
このパターンは、専門家の厳しい審査を経て、より的確で詳細なフィードバックを生み出すようになりました。また、適切なタスクに適切なエージェント システムを設計することの重要性を強調しています。
AutoGen は、グループ チャットやネストされたチャットなど、さまざまなデザイン パターンの例を提供していますが、この分野はきわめて初期段階にあり、デザインやアーキテクチャの可能性は無限です。次のような提案やホワイトペーパーを検討しました。
これは非常に魅力的な分野であり、私たちは Super Vision Studios での意思決定と運用能力にロケット燃料を提供するために、新しいフレームワークとデザイン パターンを積極的に実験しています。これがあなたにとって興味深い分野である場合は、ぜひ私たちに連絡してください。私たちはこの分野の他の賢明な実践者と交流したいと思っています。
スーパービジョンスタジオについて
Super Vision は、「未来のブランド」の構築に重点を置いた AI 主導のベンチャー スタジオです。
詳細については、