Este artículo fue coescrito con Tim Shea de Super Vision Studio.
De lejos, el caso de uso más atractivo de la IA generativa no es reemplazar a los trabajadores humanos ni automatizar flujos de trabajo estrictamente definidos, sino más bien aumentar enormemente las dimensiones que las personas pueden explorar al tomar una decisión. De esta manera, los modelos de difusión y los modelos de LLM son socios increíbles para la lluvia de ideas. Podemos instruir a los modelos de LLM sobre el dominio de conocimiento que nos gustaría que representaran y luego definir con precisión cómo nos gustaría ver el resultado. Por ejemplo, podríamos preguntar:
“Quiero crear una base de datos de los holdings minoristas de lujo como VF Corporation, New Guard Group, Only The Brave y LVMH, así como de las marcas que han adquirido recientemente. ¿Puede generar una hoja de cálculo de Excel con las siguientes columnas: holding, nombre de la marca, monto de la adquisición, fecha de adquisición y fundamento de la adquisición?”
Consultas como ésta ahora se consideran algo obligatorio, una mejora asombrosa respecto de los motores de búsqueda tradicionales que ahora parecen anticuados en la era de la IA generativa.
Sin embargo, algunos procesos de toma de decisiones pueden ser extremadamente complejos. A veces nos gustaría poder modelar la toma de decisiones que podría ocurrir entre múltiples personas especializadas (como un CEO, CMO o CTO) o módulos especializados (como un conector API, un analizador K1 o un analizador FODA). En el mundo real, tomaríamos los resultados de esa hoja de cálculo de Excel y los pasaríamos por un grupo de expertos humanos. Estrategas, inversores y expertos en el sector participarían. Construiríamos "qué pasaría si" sobre las adquisiciones, analizaríamos las pérdidas y ganancias y soñaríamos con planes de salida al mercado para posibles adquisiciones futuras. Pero gracias a los LLM modernos, ahora podemos crear agentes de IA individualizados que pueden modelar cada uno de estos comportamientos y simular tener una sala llena de expertos que informan nuestras decisiones.
Por eso, cuando fundamos Super Vision Studio (un estudio de riesgo acelerado por IA enfocado en crear “marcas del futuro”), inmediatamente recurrimos a sistemas de IA multiagente para modelar los procesos de toma de decisiones patentados que llamamos nuestro “Super Vision OS”. Con él, podemos rastrear bases de datos empresariales masivas en busca de modelos de pérdidas y ganancias débiles en los que la IA pueda ofrecer mejoras descomunales. Podemos encargar a los agentes de nuestro SO hipótesis sobre venta minorista, bienes de consumo masivo, impresión, entretenimiento o comercio electrónico. Los agentes pueden analizar números, pontificar y debatir entre ellos. Los agentes pueden incluso producir resultados que otros agentes critican y repiten.
Los sistemas multiagente tienen una serie de ventajas sobre las interfaces de chat LLM simples: cada agente del sistema puede recibir capacitación con una enorme cantidad de conocimientos especializados.
También contamos con una amplia gama de opciones listas para usar para implementar sistemas multiagente personalizados, como AutoGen, CrewAI y LangChain. Elegimos AutoGen porque es gratuito, hay muchos videos introductorios y proporciona un código de muestra para varias arquitecturas multiagente diferentes que se pueden configurar y combinar. AutoGen cataloga una extensa lista de ejemplos de lo que denomina "patrones de conversación" (como chat de dos agentes, chat secuencial, chat grupal y chat anidado).
Estos patrones, o arquitecturas, son una parte importante del proceso de diseño del sistema de agentes. Es similar a cómo se forma un equipo de expertos humanos y se predefinen las reglas de interacción entre ellos. Diferentes diseños pueden producir resultados muy diferentes.
El patrón más simple que ofrece AutoGen es un chat entre dos agentes, en el que definimos la personalidad de cada agente, en el que un agente simplemente le pregunta al otro agente la pregunta original y en el que los agentes analizan un problema una cantidad determinada de veces. Es fácil de configurar y podemos leer cada interacción dentro de la conversación textualmente. El código de muestra se encuentra a continuación:
import os from autogen import ConversableAgent agent__venture_studio_founder = ConversableAgent ( name="Agent__Venture_Studio_Founder", system_message="You are the founder owner of a venture studio with expertise in funding and building technology and retail brands.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, ) agent__business_analyst = ConversableAgent ( name="Agent__Business_Analyst", system_message="You are an expert business analyst with deep expertise in finance, strategy, marketing, and operations.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, ) chat_result = agent__venture_studio_founder.initiate_chat ( agent__business_analyst, message="""I want to identify companies that traditionally have weak P&L's such as thin profit margins, fickle customers, or are high susceptibility to market swings. Our thesis is we want to focus on industries such as Retail, CPG, Print, Entertainment, and e-Commerce so we only want to look at types of companies in those specific industries. We want to choose company types where Generative AI can produce outsized efficiencies to the P&L's. Don't want to consider company types where Generative AI cannot help. """, summary_method="reflection_with_llm", max_turns=2, )
El resultado es bastante útil y nos da a los humanos algunas ideas sobre qué hacer a continuación, pero no es mucho más valioso que simplemente hacerle la misma pregunta a ChatGPT en un solo mensaje.
Un patrón un poco más avanzado es un chat secuencial. En este caso, configuramos varios chats de dos agentes, donde el resultado de cada chat de dos agentes se transmite a varios chats de dos agentes posteriores. Piense en este diseño como si un director ejecutivo le asignara una tarea a un empleado de nivel inferior, quien toma decisiones y luego las pasa a través de varios niveles de aprobación. A continuación, se incluye un código de muestra para este diseño.
# Define the Orchestrator agent__orchestrator = ConversableAgent( name="Agent__Orchestrator", system_message="You coordinate the analysis of an industry by passing tasks to other agents and summarizing their feedback.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the Brainstorm Agent agent__brainstorm_analyst = ConversableAgent( name="Agent__Brainstorm_Analyst", system_message="You analyze the given industry and generate a list of company types with weak P&L models where AI can deliver substantial improvements. Return this list.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CFO agent__cfo = ConversableAgent( name="Agent__CFO", system_message="You criticize the provided list of company types from a financial POV, identifying weaknesses in margins, capex, opex, inventory, and liquidity. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CTO agent__cto = ConversableAgent( name="Agent__CTO", system_message="You criticize the provided list of company types from a technology POV, identifying risks in tech implementation, cost, complexity, and feasibility. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", ) # Define the CMO agent__cmo = ConversableAgent( name="Agent__CMO", system_message="You criticize the provided list of company types from a marketing POV, identifying risks in go-to-market, media costs, and customer acquisition and retention. Remove companies that are too risky.", llm_config={"config_list": [{"model": "gpt-4", "api_key": os.environ["OPENAI_API_KEY"]}]}, human_input_mode="NEVER", )
Este patrón produce comentarios mucho más precisos y detallados ahora que ha sido examinado por un grupo de expertos y enfatiza la importancia de diseñar el sistema de agente correcto para la tarea correcta.
AutoGen ofrece ejemplos de muchos patrones de diseño diferentes, incluidos chats grupales y chats anidados, pero el campo es increíblemente incipiente y los diseños y arquitecturas potenciales son ilimitados. Hemos analizado propuestas y documentos técnicos para:
Es un campo fascinante y estamos experimentando activamente con nuevos marcos y patrones de diseño para impulsar nuestras capacidades operativas y de toma de decisiones en Super Vision Studios. Si este es un campo interesante para usted, comuníquese con nosotros; nos encantaría interactuar con otros profesionales inteligentes en el campo.
Acerca de Super Vision Studio
Super Vision es un estudio de emprendimiento impulsado por inteligencia artificial enfocado en construir “marcas del futuro”.
Para obtener más información, visite