ChatGPT が最初に大流行した頃、元同僚からテキストメッセージが届きました。彼は私にアイデアを相談したいと言っていました。いつもブレインストーミングを楽しむ彼は電話で話し始めました。彼は「いつも私にデータを引き出すように頼んでいたのを覚えてる?自分でデータを引き出せたらどう?」と切り出しました。そして、何千人(何万人?)もの人が同時に考えていたアイデアを私に提案しました。それは、テキストから SQL への変換に LLM を使用すれば、技術に詳しくない人でもデータに関する質問に自分で答えられるようになる、というアイデアです。
私はそのアイデアに夢中になりましたが、飛び込む前に、Lei (現在の私の CTO) に検証が必要だと伝えました。私たちはさまざまな業界の友人や元同僚に連絡を取りました。本物の「セルフサービス分析」に強い関心がありました。見た目よりもはるかに複雑であることはわかっていましたが、この機会を逃すのはもったいないと思いました。そこで、Lei と私は The Shire を離れ、ビジョンを形にする旅に乗り出しました。
この投稿は当社の製品自体に関するものではありません(ただし、興味があれば、以下のアイデアのいくつかが当社の最近の製品開発にどのように影響したかについてさらに読むことができます)。
注: この旅には魔法使いや中つ国の壮大な戦いがまったくありません。🧙
「なぜ」について長々と語るつもりはありません。これを読んでいるあなたは、おそらく次の 2 つのグループのいずれかに当てはまるでしょう。
データ アナリストやデータ サイエンティストの役割に関する懸念を無視すれば、組織のデータに関するあらゆる質問に答えられる全知の AI というアイデアは魅力的に思えます。少なくとも、新しい質問の仕方に対する創造性が際限のない組織やそのビジネス リーダーにとっては魅力的に思えます。この AI は、すべてのリーダーが経験的証拠に基づいて戦略的決定を下す「データ駆動型」組織を作成するためのソリューションになる可能性があります。しかも、通常かかるコストのほんの一部で済みます。ついに、組織は 2010 年以来耳にしていた「新しい石油」を活用できるようになります。
しかし、これが解決すべき非常に価値のある問題であり、AI が非常に優れたものになっているのなら、なぜこれまで実際にこれを解決した製品がないのでしょうか?
最近の業界調査では、企業における AI 導入の複雑な状況が描かれています。
AI を導入する企業、特に企業では、テクノロジーに対する期待値が非常に高くなっています。データ分析とセルフサービスという夢の文脈において、私たちは AI ツールに次のことを期待しています。
残念ながら、現在のソリューションのほとんどは従来のモノリシック AI フレームワークを使用しており、期待に応えられないことがよくあります。過去数年間、Fabi.ai チームと私はこの問題に懸命に取り組んできました。エンタープライズ向けのプロトタイプを構築し、多くのオプションを検討しました。最終的に、現在のモノリシック フレームワークでは、検索拡張生成 (RAG) も微調整もこの問題を解決できないことがわかりました。
このアプローチをテストしたところ、いくつかのことが明らかになりました。
これらの問題を検討した後、私たちは AI を問題にうまく適応させるにはどうしたらよいかを考えました。そこで AI エージェントが登場し、このコンセプトを固めてくれました。
エージェント フレームワークを目にした瞬間、これが状況を変えるだろうと分かりました。突然、AI に質問への回答方法を決定させることができると感じました。AI は、手順を実行し、自動的にトラブルシューティングを行うことができます。AI が「アカウント タイプ」フィールドに null 値がない SQL クエリを記述した場合、クエリをドライ ランしてエラーを見つけ、自動的に修正することができます。しかし、これをさらに進めて、AI が主に Python で動作し、LLM を活用できるようにしたらどうでしょうか。これで、AI はデータを取得する以上のことを行います。通常は手動で探す必要がある外れ値、傾向、独自の洞察を見つけるために、Python パッケージまたは LLM を使用できます。
しかし、まだ問題が1つありました。それは、乱雑な企業データです。私たちは、組織が強力なデータエンジニアリング手法、たとえば
企業が成長するにつれて、取り扱うデータやユーザー数も増えます。エージェント メッシュの考え方は、迅速な意思決定とガバナンスに必要な制御のバランスをとるのに役立ちます。専門のエージェントは、各 AI の明確な境界と責任を設定するのに役立ちます。また、エージェントが通信するためのスケーラブルな方法も作成します。さらに、チームや企業全体でリソースを効率的に管理するのに役立ちます。
特殊エージェントの背後にある考え方は、このエージェントは非常に厳密に定義されたデータセットに関する質問にのみ回答できるというものです。たとえば、マーケティング キャンペーンに関する質問に答える AI エージェントを作成して起動できます。または、マーケティング パイプラインに関する質問に答える別のエージェントを構築することもできます。
ただ 1 つ欠点があります。ユーザーは、どの質問に対してどのエージェントに問い合わせればよいかを知る必要があります。これは、一般的な質問をするのと、質問をする適切なマーケティング アナリストを知る必要があるのと似ています。一般的な質問であれば、チームの誰かが適切な担当者に問い合わせることができます。ここで、「エージェント メッシュ」という概念が役立ちます。
単一のエージェントがドメイン固有の質問に確実に回答できるのであれば、エージェント同士が会話できるようにしてはどうでしょうか。たとえば、マーケティング キャンペーン エージェントがパイプライン エージェントに、質問にもっと簡単に回答できるかどうかを直接尋ねられないのはなぜでしょうか。私たちはそれができるはずだと考えています。実際、将来的にはエージェントのネットワークが階層構造になると考えています。「GTM エージェント」が「マーケティング エージェント」に電話をかけると想像してみてください。このエージェントは次に「パイプライン エージェント」と「マーケティング キャンペーン エージェント」の両方に電話をかけます。
このアイデアは、AIの周りで広まっている「
このメッシュ アプローチは、モノリシック AI (純粋なセマンティック レイヤー上) に比べて、いくつかの重要な利点があります。
結局のところ、メッシュというアイデアは目新しいものではありません。これは、LLM の精度を向上させることが実証されている専門家の混合という概念を反映しています。これは、同じアイデアを AI エージェントに取り入れただけです。
Fabi.ai では、アナリスト エージェント メッシュの構築にはまだ長い道のりが残っています。しかし、その過程で、すでにいくつかの大きな技術インフラストラクチャの課題を克服しました。
AI データ アナリスト エージェントには、独自のアーキテクチャが必要です。この設計では、エージェントが Python または LLM を使用して質問に答え、データ ソースと同期し、コラボレーション プラットフォームに適合しながら、セキュリティとスケーラビリティを維持できるようにする必要があります。各エージェントは独自の Python カーネルで動作する必要があり、コストを削減し、ソース データと同期を維持するために、カーネルをすばやく起動または停止する必要があります。
各エージェントに個別のカーネルを提供しないアーキテクチャでは、次のいずれかのリスクが発生する可能性があります。
この種のプラットフォームを構築するという課題は、DevOps の課題であると同時に AI の課題でもあります。
企業が業務で管理する AI アプリケーションが増えるにつれて、専門的で適切に管理されたアプローチが必要になります。エージェント メッシュ フレームワークは、データ分析で AI を拡張する手段として、専門の AI データ エージェントを使用します。このアプローチにより、セキュリティ、信頼性、パフォーマンスが維持されます。
AI は今ごろどこにでも存在し、ほとんどのデータに関する質問に答えているだろうと予想していたかもしれません。しかし、よく見ると、ChatGPT がリリースされてからわずか 2 年で進歩が目覚ましいことがわかります。この道のりで学ぶべきことはまだまだたくさんあります。しかし、私の考えでは、エージェントとエージェント メッシュ フレームワークがエンタープライズ AI の鍵となるでしょう。