No calor da mania inicial de ChatGPT, recibín un texto dun antigo compañeiro de traballo. Quería facerme unha idea. Sempre quen gozaba da chuvia de ideas, fixemos unha chamada e el comezou con "Lembras como sempre me pedías que puidese sacar datos para ti? E se puideses facelo ti mesmo?" E despois procédese a presentarme unha idea que miles (¿decenas de miles?) doutras persoas estaban pensando ao mesmo tempo: os LLM poderían usarse para o texto a SQL para axudar a xente menos técnica a responder as súas propias preguntas de datos.
Estaba enganchado coa idea, pero antes de mergullarse de cabeza, díxenlle a Lei (agora o meu CTO) que tiñamos que facer algunha validación. Contactamos con amigos e antigos compañeiros de traballo de varias industrias. Houbo un forte interese pola "analítica de autoservizo". Sabíamos que sería moito máis complicado do que parecía, pero a oportunidade parecía demasiado boa para deixar pasar. Entón Lei e eu deixamos The Shire e embarcamos na nosa viaxe para crear a nosa visión:
Esta publicación non trata sobre o noso produto en si (aínda que, se tes curiosidade, podes ler máis sobre como algunhas das ideas que aparecen a continuación informaron o noso traballo recente de produtos
Nota: esta viaxe carece lamentablemente de magos e batallas épicas na Terra Media. 🧙
Non nos demoraremos moito no "por que". Se estás lendo isto, é probable que te encantes nun dos dous grupos:
Ignorando a preocupación polo papel dos analistas de datos e dos científicos, a idea dunha IA omnisciente que poida responder a calquera pregunta sobre os datos dunha organización soa ben. Ou polo menos, parece ben para a organización e os seus líderes empresariais, cuxa creatividade para novas formas de facer preguntas non ten límites. Esta IA podería ser a solución para crear unha organización "dirixida por datos" onde todos os líderes se apoien en evidencias empíricas para tomar as súas decisións estratéxicas. E todo a unha fracción do custo que levaría normalmente. Por fin! As organizacións poden aproveitar ese "novo petróleo" do que levan escoitando desde 2010.
Pero se este é un problema tan valioso de resolver e a IA tense tan boa, por que ningún produto o resolveu ata agora?
As enquisas recentes da industria debuxan unha imaxe complexa da adopción da IA na empresa.
Os adoptantes da IA, especialmente na empresa, teñen un alto nivel cando se trata das expectativas da tecnoloxía. No contexto da análise de datos e do soño de autoservizo, esperamos que a nosa ferramenta de IA:
Lamentablemente, a maioría das solucións actuais usan un marco de IA monolítico tradicional, que moitas veces non satisface as expectativas. Nos últimos anos, o equipo de Fabi.ai e eu traballamos moito neste tema. Construímos prototipos para a empresa e exploramos moitas opcións. Ao final, decatámonos de que nin a Xeración de Aumento de Recuperación (RAG) nin a posta a punto poderían solucionar este problema co marco monolítico actual.
Cando probamos este enfoque, quedaron claras algunhas cousas:
Despois de analizar estes problemas, pensamos en como facer que a IA se adaptase mellor aos problemas. Foi entón cando os axentes de IA entraron en xogo e solidificaron este concepto para nós.
No momento en que puxemos os ollos en marcos axentes, soubemos que cambiaría o xogo. De súpeto sentimos que podíamos deixar que a IA decida como responder ás preguntas. Podería funcionar a través de pasos e solucionar problemas por si só. Se a IA escribe unha consulta SQL que non ten valores nulos no campo "Tipo de conta", pode executar a consulta en seco, detectar o erro e solucionalo por si mesmo. Pero e se puidésemos dar un paso máis e deixar que a IA funcione principalmente en Python e aproveitar os LLM? Agora, a IA fai máis que extraer datos. Pode usar paquetes de Python ou LLM para atopar valores atípicos, tendencias ou coñecementos únicos, que normalmente terías que buscar manualmente.
Pero aínda tiñamos un problema: os datos desordenados da empresa. Criamos que as organizacións podían resolver isto utilizando prácticas sólidas de enxeñería de datos, como a
A medida que as empresas crecen, manexan máis datos e teñen máis usuarios. A idea de malla de axente axuda a equilibrar a rápida toma de decisións co control necesario para o goberno. Os axentes especializados axudan a establecer límites e responsabilidades claras para cada IA. Tamén crean un xeito escalable para que os axentes se comuniquen. Ademais, poden axudar a xestionar os recursos de forma eficiente en equipos e empresas.
A idea detrás dun axente especializado é que este axente só pode responder preguntas sobre un conxunto de datos moi ben definido. Por exemplo, podes crear e lanzar un axente de IA que responda preguntas sobre campañas de mercadotecnia. Ou podes crear outro para responder preguntas sobre o pipeline de mercadotecnia, etc.
Só hai un defecto: os usuarios deben saber a que axente acudir para que pregunta. É como ter que coñecer ao analista de mercadotecnia axeitado para facer unha pregunta en comparación con só facer unha pregunta xeral. Cunha pregunta xeral, alguén do equipo pode dirixila á persoa adecuada. Aquí é onde entra en xogo o concepto de "malla de axente".
Se un só axente pode responder de forma fiable preguntas específicas do dominio, entón por que non deixar que os axentes falen entre eles? Por que, por exemplo, o axente da campaña de mercadotecnia non pode simplemente preguntarlle directamente ao axente de canalización se pode responder unha pregunta máis facilmente? Cremos que debería ser capaz. De feito, pensamos que no futuro haberá redes de axentes con estrutura xerárquica. Podes imaxinar un "axente GTM" que chama ao "axente de mercadotecnia". Este axente chama entón ao "axente de pipeline" e ao "axente da campaña de marketing".
Esta idea é como unha idea máis xeral flotando arredor da IA coñecida como "
Este enfoque de malla ofrece algunhas vantaxes clave sobre unha IA monolítica (nunha capa semántica prístina):
Ao final, esta idea dunha malla non é nova. Isto reflicte o concepto dunha mestura de expertos que se demostrou que mellora a precisión dos LLM. Simplemente é tomar esa mesma idea e achegala aos axentes de IA.
En Fabi.ai, temos un longo camiño por percorrer mentres creamos unha malla de axente de analistas. Pero, xa superamos algúns dos grandes desafíos de infraestrutura técnica ao longo do camiño.
Os axentes analistas de datos de IA necesitan unha arquitectura única. Este deseño debe permitirlles usar Python ou LLMs para responder preguntas, manterse sincronizado coas fontes de datos e encaixar en plataformas colaborativas, mentres seguen sendo seguros e escalables. Cada axente debe operar no seu propio núcleo de Python, que debe ser xirado rapidamente cara arriba ou abaixo para reducir custos e manterse sincronizado cos datos de orixe.
As arquitecturas que non proporcionan núcleos individuais a cada axente poden correr nalgún dos seguintes riscos:
O desafío de construír este tipo de plataforma é tanto un desafío de IA como un desafío de DevOps.
Como as empresas empresariais xestionan máis aplicacións de IA nas súas operacións, necesitan enfoques especializados e ben gobernados. O marco de malla de axentes usa axentes de datos de IA especializados como medio para escalar a IA na análise de datos. Este enfoque mantén intactos a seguridade, a fiabilidade e o rendemento.
Poderiamos esperar que a IA estivese en todas partes a estas alturas, respondendo á maioría das preguntas sobre datos. Pero, se miramos detidamente, o progreso en só dous anos desde o lanzamento de ChatGPT é impresionante. Aínda temos moito que aprender nesta viaxe. Non obstante, na miña opinión, os axentes e os marcos de malla de axentes serán clave para a IA empresarial.