La majoria de les descripcions d'agents d'IA i sistemes d'agent se centren en la capacitat dels agents d'actuar de manera autònoma, sense intervenció de l'usuari, en moltes situacions en els casos d'ús prevists pels agents. Alguns agents operen amb un model human-in-the-loop, implicant l'usuari només quan es troben amb incertesa, però encara actuen de manera autònoma en circumstàncies típiques i determinades.
Com que l'autonomia és la principal característica que defineix els agents d'IA, hi ha capacitats de suport que els agents necessiten per actuar de manera independent de l'entrada de l'usuari. En
Capacitat i accés: la capacitat d'actuar en nom de l'usuari, inclosos els permisos i l'accés autenticat als sistemes rellevants.
Raonament i planificació - Utilitzar el raonament per prendre decisions dins d'un procés de pensament estructurat, sovint definit com una cadena, arbre, gràfic o algorisme, que guia les accions de l'agent.
Orquestració de components: coordinació de múltiples parts, incloses les indicacions, els LLM, les fonts de dades disponibles, el context, la memòria, l'historial i l'execució i l'estat d'accions potencials.
Baranes: mecanismes per mantenir l'agent concentrat i eficaç, incloses les garanties per evitar errors o proporcionar informació útil de diagnòstic en cas de fallada.
Cadascun d'aquests quatre requisits té necessitats d'infraestructura diferents. Per a la capacitat i l'accés, les necessitats principals són integracions de programari i gestió de credencials. El raonament i la planificació estan recolzats principalment per LLM i altres models d'IA. El tema de les baranes és ampli i sovint específic per als casos d'ús implicats, així que ho guardarem per a un article futur. Aquí, m'agradaria centrar-me en l'orquestració i la infraestructura necessària per donar suport a l'orquestració intel·ligent en un gran nombre de parts mòbils i una llarga història de dades i context que es poden necessitar en el moment de la decisió.
Suposant que els dos primers requisits anteriors (inclosos l'habilitat, l'accés, el raonament i la planificació) funcionen com es pretén, el principal repte de l'orquestració de components es redueix a la gestió del coneixement. El sistema agent ha de mantenir la consciència en una varietat de nivells: les seves tasques i objectius principals, l'estat de diversos sistemes rellevants, l'historial d'interaccions amb l'usuari i altres sistemes externs, i potencialment més.
Amb els LLM, utilitzem el concepte de "finestra de context" per descriure el conjunt d'informació disponible per al model, generalment en un moment puntual. Això és diferent de la informació continguda a la sol·licitud en sí i també diferent del conjunt de coneixements interns del LLM que es va formar durant el procés de formació del model.
En els textos llargs, les finestres de context es poden considerar com un "historial recent" de la informació que està disponible per al LLM en el moment de l'indicació, això està implícit en l'arquitectura dels LLM i les indicacions. D'aquesta manera, la majoria dels LLM tenen un concepte unidimensional de context, i el context més antic simplement cau fora de la finestra amb el temps.
Els agents necessiten un sistema més sofisticat de gestió del context i del coneixement, per tal de garantir que el context més important o urgent es prioritza, sempre que l'agent necessiti prendre una decisió. En lloc d'un únic context monolític, els agents d'IA han de fer un seguiment de diferents tipus de context amb diferents nivells d'importància.
Això es pot comparar amb la memòria dels sistemes informàtics, on els diferents tipus d'emmagatzematge (la memòria cau, la memòria RAM i els discs durs) tenen diferents propòsits segons l'accessibilitat i la freqüència d'ús. Per als agents d'IA, podem estructurar conceptualment el context en tres nivells principals:
Context primari: la llista de tasques o objectius principals de l'agent. Això ha de ser sempre el més important, guiant totes les accions.
Context directe: l'estat dels sistemes connectats i rellevants i de l'entorn immediat, inclosos recursos com ara sistemes de missatgeria, fonts de dades, API crítiques o el correu electrònic i els calendaris d'un usuari.
Context extern – Coneixement general, o qualsevol informació que pugui ser rellevant, però que no està dissenyada explícitament per ser una part bàsica del sistema agent. El context extern podria ser proporcionat per alguna cosa tan simple com una cerca a Internet o a la Viquipèdia. O bé, podria ser urgent i complicat, com ara factors inesperats que sorgeixen de notícies o actualitzacions de tercers, que requereixin que l'agent adapti les seves accions de manera dinàmica.
Aquests nivells de context no són definitius, les línies entre ells poden ser molt borroses i hi ha altres maneres útils de descriure els tipus de context, però aquesta estructura conceptual és útil per a la nostra discussió aquí.
Les necessitats d'emmagatzematge dels agents d'IA varien segons el tipus de context que es gestiona. Cada nivell (context primari, directe i extern) requereix diferents estructures de dades, mecanismes de recuperació i freqüències d'actualització. El repte clau és garantir l'accés eficient, la persistència a llarg termini i les actualitzacions dinàmiques sense sobrecarregar la canalització de processament de l'agent.
En lloc de tractar el context com una entitat monolítica, els agents d'IA es beneficien d'arquitectures d'emmagatzematge híbrids que combinen models de dades estructurats i no estructurats. Això permet cerques ràpides, recuperació semàntica i persistència escalable, assegurant que el context rellevant estigui disponible quan sigui necessari alhora que es minimitza el processament de dades redundant.
El context principal consisteix en els objectius bàsics de l'agent i les tasques actives, la base que impulsa la presa de decisions. Aquesta informació ha de ser persistent, altament estructurada i de fàcil consulta, ja que guia totes les accions de l'agent.
Necessitats potencials d'emmagatzematge:
Exemple d'implementació d'un agent
Un assistent de programació que gestiona una cua de tasques ha d'emmagatzemar:
Un magatzem de dades distribuït i d'alta disponibilitat garanteix que les tasques es facin un seguiment fiable, fins i tot quan l'agent processa nous esdeveniments i actualitzacions de context.
El context directe inclou l'estat actual dels sistemes rellevants: calendaris, plataformes de missatgeria, API, bases de dades i altres fonts de dades en temps real. A diferència del context primari, el context directe és dinàmic i sovint requereix una combinació de solucions d'emmagatzematge estructurades i en temps real.
Necessitats potencials d'emmagatzematge:
Exemple d'implementació de l'agent:
Un agent d'AI d'atenció al client que fa un seguiment de les interaccions dels usuaris en directe ha d'emmagatzemar:
En estructurar l'emmagatzematge de context directe amb una combinació de magatzems de dades sensibles al temps i a llarg termini, els agents d'IA poden actuar amb consciència del seu entorn sense una latència excessiva.
El context extern inclou el coneixement general i les actualitzacions inesperades de fonts fora del control immediat de l'agent. Això podria anar des de consultes de cerca sota demanda fins a dades externes ingerides dinàmicament, que requereixen un enfocament flexible per a l'emmagatzematge i la recuperació. A diferència dels contextos primaris i directes, que estan estretament lligats a les tasques en curs de l'agent i als sistemes connectats, el context extern sovint és desestructurat, ampli i de rellevància molt variable.
Consideracions potencials d'emmagatzematge:
Exemple d'implementació de l'agent:
Un assistent personal que elabori un informe sobre els darrers descobriments científics en investigació sobre el canvi climàtic ha de:
Mitjançant l'estructuració de l'emmagatzematge de context extern al voltant de la recuperació ràpida i l'organització semàntica, els agents d'IA poden adaptar-se contínuament a la nova informació alhora que garanteixen que les dades recuperades segueixen sent rellevants, creïbles i accionables.
Dissenyar agents d'IA conscients del context requereix un equilibri acurat entre l'accés eficient a la informació crítica i evitar la sobrecàrrega de memòria o de processament. Els agents d'IA han de decidir quan emmagatzemar, recuperar i processar el context de manera dinàmica per optimitzar la presa de decisions.
Una arquitectura d'emmagatzematge híbrida, que integra models transaccionals, vectorials, de sèries temporals i basats en esdeveniments, permet als agents d'IA mantenir la persistència del context, l'eficiència de recuperació i la intel·ligència adaptativa, tot això crucial per a l'autonomia a escala. Aconseguir aquest equilibri requereix estratègies estructurades en tres dimensions clau:
Latència versus persistència: el context d'accés freqüent (p. ex., estats de tasques actius) hauria de residir en un emmagatzematge de baixa latència, mentre que els coneixements necessaris amb menys freqüència però essencials (p. ex., interaccions històriques) s'han de recuperar a demanda de l'emmagatzematge a llarg termini.
Dades estructurades versus dades no estructurades: les tasques, els objectius i els estats del sistema es beneficien de l'emmagatzematge estructurat (p. ex., bases de dades clau-valor o documents), mentre que la recuperació de coneixement més àmplia requereix incrustacions no estructurades i relacions de gràfics per capturar el context de manera eficaç.
Consciència en temps real versus històrica: alguns contextos requereixen un seguiment continu (per exemple, respostes d'API en directe), mentre que d'altres (per exemple, decisions o informes previs) només s'han de recuperar quan siguin rellevants per a la tasca actual de l'agent.
Tenint en compte aquests diferents tipus de contextos, els agents d'IA necessiten un enfocament estructurat per emmagatzemar i accedir a la informació. Confiar només en finestres de context de LLM és ineficient, ja que limita la capacitat de l'agent per fer un seguiment de les interaccions a llarg termini i de les situacions en evolució. En lloc d'això, el context s'ha d'emmagatzemar de manera persistent, recuperar-lo dinàmicament i prioritzar segons la rellevància i la urgència.
A la pràctica, es requereixen models de memòria multinivell que combinen memòria cau a curt termini, bases de dades persistents i mecanismes de recuperació externs per a arquitectures escalables d'agents d'IA. Aprofitant un enfocament d'emmagatzematge híbrid, els agents d'IA poden:
Mitjançant la integració d'aquestes estratègies d'emmagatzematge, els agents d'IA poden funcionar de manera autònoma, mantenir la consciència del context durant llargs períodes i respondre de manera dinàmica a la nova informació, assentant les bases per a sistemes agentics realment intel·ligents i escalables.
La implementació d'una arquitectura d'emmagatzematge híbrida per als agents d'IA requereix seleccionar les bases de dades i les eines d'emmagatzematge adequades per gestionar diferents tipus de contextos de manera eficient. La millor opció depèn de factors com ara els requisits de latència, l'escalabilitat, la compatibilitat de l'estructura de dades i els mecanismes de recuperació.
Un sistema d'emmagatzematge d'agents d'IA ben dissenyat normalment inclou:
Fem una ullada més de prop a cadascun d'aquests elements.
Els agents d'IA requereixen bases de dades transaccionals escalables i altament disponibles per emmagatzemar tasques, objectius i metadades estructurades de manera fiable. Aquestes bases de dades garanteixen que el context primari estigui sempre disponible i que es pugui consultar de manera eficient.
Per a la supervisió del sistema en temps real, els agents d'IA necessiten bases de dades optimitzades per al registre, el seguiment d'esdeveniments i la persistència de l'estat.
Els agents d'IA que treballen amb coneixement no estructurat requereixen maneres eficients d'emmagatzemar, cercar i recuperar incrustacions per a tasques com la cerca semàntica, la concordança de semblança i la generació augmentada per la recuperació (RAG). Un sistema de cerca vectorials ben optimitzat permet als agents recordar interaccions, documents o fets passats rellevants sense sobrecarregar la memòria o les finestres de context.
Els agents d'IA requereixen un accés de baixa latència al context de referència freqüent, fent de la memòria cau un component essencial de les arquitectures d'emmagatzematge híbrid.
Mitjançant la integració d'aquestes diverses solucions d'emmagatzematge, els agents d'IA poden gestionar de manera eficient la memòria a curt termini, el coneixement persistent i les actualitzacions en temps real, garantint una presa de decisions perfecta a escala. La combinació de bases de dades transaccionals, emmagatzematge de sèries temporals, cerca vectorial i memòria cau permet als agents equilibrar la velocitat, l'escalabilitat i la consciència contextual, adaptant-se de manera dinàmica a les noves entrades.
A mesura que les aplicacions basades en IA continuen evolucionant, la selecció de l'arquitectura d'emmagatzematge híbrida adequada serà crucial per habilitar sistemes agents autònoms, sensibles i intel·ligents que puguin funcionar de manera fiable en entorns complexos i en constant canvi.
A mesura que els sistemes d'IA es facin més complexos, les bases de dades híbrides seran crucials per gestionar la memòria a curt i llarg termini, les dades estructurades i no estructurades i la informació històrica i en temps real. Els avenços en la generació augmentada per la recuperació (RAG), la indexació semàntica i la inferència distribuïda fan que els agents d'IA siguin més eficients, intel·ligents i adaptatius. Els futurs agents d'IA confiaran en un emmagatzematge ràpid, escalable i conscient del context per mantenir la continuïtat i prendre decisions informades al llarg del temps.
Els agents d'IA necessiten solucions d'emmagatzematge que gestionen de manera eficient diferents tipus de context alhora que garanteixen velocitat, escalabilitat i resiliència. Les bases de dades híbrides ofereixen el millor dels dos mons: dades estructurades d'alta velocitat amb recuperació contextual profunda, fent-les fonamentals per als sistemes intel·ligents d'IA. Admeten la cerca basada en vectors per a l'emmagatzematge de coneixement a llarg termini, cerques transaccionals de baixa latència, actualitzacions en temps real basades en esdeveniments i escalabilitat distribuïda per a la tolerància a errors.
Per donar suport als agents intel·ligents d'IA, els desenvolupadors haurien de dissenyar arquitectures d'emmagatzematge que combinin diversos models de dades per a una gestió del context perfecta:
Cerca vectorial i dades en columna: emmagatzema el context semàntic juntament amb metadades estructurades per a una recuperació ràpida
Fluxos de treball basats en esdeveniments : transmeteu actualitzacions en temps real per mantenir els agents d'IA al corrent del canvi de dades
Escala global i resiliència: implementeu-vos a través de xarxes distribuïdes per a una alta disponibilitat i tolerància a errors
En integrar el processament transaccional, la cerca vectorial i les actualitzacions en temps real,
Escrit per Brian Godsey, DataStax