paint-brush
Иза АИ агената: инфраструктура која подржава аутономијуод стране@datastax
Нова историја

Иза АИ агената: инфраструктура која подржава аутономију

од стране DataStax11m2025/01/29
Read on Terminal Reader

Предуго; Читати

Сазнајте више о инфраструктури која подржава оркестрацију кроз многе покретне делове и дугу историју података и контекста потребних за изградњу агентских система.
featured image - Иза АИ агената: инфраструктура која подржава аутономију
DataStax HackerNoon profile picture


Већина описа АИ агената и агентских система фокусира се на способност агената да делују аутономно, без интервенције корисника, у многим ситуацијама у свим случајевима предвиђене употребе агената. Неки агенти раде са моделом човека у петљи, ангажујући корисника само када наиђу на неизвесност, али и даље делују аутономно под типичним и одређеним околностима.


С обзиром да је аутономија главна карактеристика АИ агената, постоје могућности подршке које су агентима потребне да би деловали независно од корисничког уноса. Ин ранији пост на блогу , идентификовали смо четири захтева за агентске АИ архитектуре:


  1. Способност и приступ – Могућност деловања у име корисника, укључујући дозволе и аутентификован приступ релевантним системима.


  2. Резоновање и планирање – Коришћење расуђивања за доношење одлука у оквиру структурираног мисаоног процеса—често дефинисаног као ланац, дрво, графикон или алгоритам—који усмерава акције агента.


  3. Оркестрација компоненти – Координација више делова, укључујући упите, ЛЛМ, доступне изворе података, контекст, меморију, историју и извршење и статус потенцијалних радњи.


  4. Заштитне ограде – Механизми који одржавају агента фокусираним и ефикасним, укључујући мере заштите за избегавање грешака или пружање корисних дијагностичких информација у случају неуспеха.


Сваки од ова четири захтева има различите инфраструктурне потребе. За могућност и приступ, примарне потребе су софтверске интеграције и управљање акредитивима. Расуђивање и планирање углавном подржавају ЛЛМ и други модели вештачке интелигенције. Тема заштитних ограда је огромна и често специфична за случајеве употребе који су укључени, тако да ћемо то сачувати за будући чланак. Овде бих желео да се фокусирам на оркестрацију и инфраструктуру потребну да подржи интелигентну оркестрацију преко великог броја покретних делова и дуге историје података и контекста који би могли бити потребни у тренутку одлучивања.

Оркестрација компоненти и улога контекста у АИ агентима

Под претпоставком да прва два горе наведена захтева — укључујући способност, приступ, резоновање и планирање — функционишу како је предвиђено, главни изазов оркестрације компоненти се своди на управљање знањем. Агентски систем треба да одржава свест на различитим нивоима: о својим основним задацима и циљевима, стању различитих релевантних система, историји интеракција са корисником и другим спољним системима, и потенцијално више.


Код ЛЛМ-а користимо концепт „контекстног прозора“ да опишемо скуп информација доступних моделу, углавном у тренутку. Ово се разликује од информација садржаних у самом упиту и такође се разликује од интерног скупа знања ЛЛМ-а који је формиран током процеса обуке модела.


У дугим текстовима, прозори контекста се могу сматрати „скорашњом историјом“ информација које су доступне ЛЛМ-у у тренутку – ово је имплицитно у архитектури ЛЛМ-а и подстицању. На тај начин, већина ЛЛМ-ова има једнодимензионални концепт контекста, а старији контекст једноставно испада из прозора током времена.


Агентима је потребан софистициранији систем за управљање контекстом и знањем, како би се осигурало да најважнији или хитни контекст буде приоритет, кад год агент треба да донесе одлуку. Уместо једног монолитног контекста, АИ агенти морају пратити различите типове контекста на различитим нивоима важности.


Ово се може упоредити са меморијом у рачунарским системима, где различите врсте складишта – кеш меморија, РАМ и чврсти дискови – служе различитим сврхама на основу приступачности и учесталости коришћења. За АИ агенте, можемо концептуално структурирати контекст у три примарна нивоа:


  1. Примарни контекст – Листа главних задатака или циљеви агента. Ово увек треба да буде на уму, да води све акције.


  2. Директан контекст – Стање повезаних, релевантних система и непосредног окружења, укључујући ресурсе као што су системи за размену порука, фидови података, критични АПИ-ји или корисничка е-пошта и календари.


  3. Спољни контекст – Опште знање или било која информација која би могла бити релевантна, али која није експлицитно дизајнирана да буде кључни део агентског система. Спољашњи контекст би могао бити обезбеђен нечим једноставним као што је претрага интернета или Википедије. Или, може бити хитно и компликовано, као што су неочекивани фактори који произилазе из вести или ажурирања трећих страна, који захтевају од агента да динамички прилагођава своје акције.


Ови нивои контекста нису дефинитивни, линије између њих могу бити веома нејасне, а постоје и други корисни начини за описивање типова контекста—али ова концептуална структура је корисна за нашу дискусију овде.

Инфраструктура за складиштење за управљање контекстом

Потребе за складиштењем АИ агената варирају у зависности од типа контекста којим се управља. Сваки ниво – примарни, директни и екстерни контекст – захтева различите структуре података, механизме преузимања и учесталости ажурирања. Кључни изазов је обезбеђивање ефикасног приступа, дугорочне постојаности и динамичких ажурирања без преоптерећења цевовода обраде агента.


Уместо да контекст третирају као монолитни ентитет, АИ агенти имају користи од хибридних архитектура складиштења које спајају структуриране и неструктуриране моделе података. Ово омогућава брзо тражење, семантичко проналажење и скалабилну постојаност, обезбеђујући да је релевантан контекст доступан када је то потребно, уз минимизирање сувишне обраде података.

Примарни контекст: листе задатака и циљеви агената

Примарни контекст се састоји од главних циљева агента и активних задатака — темеља који покреће доношење одлука. Ове информације морају бити постојане, високо структуриране и лако упитне, јер усмеравају све акције агента.


Потенцијалне потребе за складиштењем:

  • Трансакционе базе података (кључ-вредност или складишта докумената) за структуриране листе задатака и хијерархије циљева.
  • Индексирање са малим кашњењем ради подршке брзом тражењу активних задатака.
  • Ажурирања заснована на догађајима како би се осигурало да задаци одражавају напредак у реалном времену.


Пример имплементације агента

Помоћник за заказивање који управља редом задатака треба да ускладишти:

  • Стални задаци (нпр. „Закажите састанак са Алексом“) са ажурирањима статуса.
  • Историја извршења (нпр. „Послата почетна е-порука, чека се одговор“).
  • Приоритети и зависности, обезбеђујући да се хитни задаци испливају први.


Дистрибуирано, високо доступно складиште података осигурава да се задаци поуздано прате, чак и када агент обрађује нове догађаје и ажурирања контекста.

Директан контекст: стање повезаних система

Директан контекст укључује тренутно стање релевантних система—календаре, платформе за размену порука, АПИ-је, базе података и друге изворе података у реалном времену. За разлику од примарног контекста, директни контекст је динамичан и често захтева комбинацију структурираних решења за складиштење у реалном времену.


Потенцијалне потребе за складиштењем:

  • Базе података временских серија за евиденцију догађаја и праћење статуса у реалном времену.
  • Кеширање слојева за стања система којима се често приступа.
  • Дохваћање засновано на векторима за контекстуалне упите о недавним интеракцијама.


Пример имплементације агента:

Агент за корисничку подршку АИ који прати интеракције корисника уживо треба да чува:

  • Историја разговора у реалном времену у продавници у меморији.
  • Стање сесије (нпр. детаљи тикета за подршку у току) у бази података временских серија.
  • АПИ кеширање одговора за екстерно тражење система, избегавајући сувишне упите.


Структурирањем директног складиштења контекста комбинацијом временски осетљивих и дугорочних складишта података, АИ агенти могу да делују са свешћу о свом окружењу без превеликог кашњења.

Екстерни контекст: преузимање и прилагођавање знања

Спољни контекст обухвата општа знања и неочекивана ажурирања из извора изван непосредне контроле агента. Ово може да варира од упита за претрагу на захтев до динамички унесених спољних података, што захтева флексибилан приступ складиштењу и преузимању. За разлику од примарног и директног контекста, који су уско повезани са текућим задацима агента и повезаним системима, спољни контекст је често неструктуриран, огроман и веома променљив у релевантности.


Разматрања о потенцијалном складиштењу:

  • Складишта докумената и базе знања за трајни, структурирани референтни материјал.
  • Векторска претрага за испитивање великих скупова података докумената, интерних или екстерних.
  • Генерација са проширеним проналажењем (РАГ ) за преузимање релевантног знања пре него што одговори.
  • Стримовање и унос на основу догађаја за ажурирања у реалном времену из спољних извора података.


Пример имплементације агента:

Лични асистент који саставља извештај о најновијим научним открићима у истраживању климатских промена треба да:

  • Преузми научне чланке из спољних извора, филтрирајући за релевантност на основу кључних речи или векторске сличности.
  • Анализирајте односе између радова , идентификујући трендове користећи графикон знања.
  • Сумирајте кључне увиде користећи генерацију проширеног преузимања заснованог на ЛЛМ-у.
  • Пратите недавна ажурирања тако што ћете се претплатити на фидове публикација и изворе вести у реалном времену.


Структурирањем екстерног складиштења контекста око брзог проналажења и семантичке организације, АИ агенти могу континуирано да се прилагођавају новим информацијама док обезбеђују да преузети подаци остају релевантни, веродостојни и делотворни.

Хибридна меморија за АИ агенте који су свесни контекста

Дизајнирање АИ агената који су свесни контекста захтева пажљив баланс између ефикасног приступа критичним информацијама и избегавања преоптерећења меморије или обраде. АИ агенти морају да одлуче када ће динамички складиштити, преузимати и обрадити контекст да би оптимизовали доношење одлука.


Хибридна архитектура складиштења – која интегрише трансакцијске, векторске, временске серије и моделе вођене догађајима – омогућава АИ агентима да одрже постојаност контекста, ефикасност преузимања и адаптивну интелигенцију, што је све кључно за аутономију на нивоу. За постизање ове равнотеже потребне су структуриране стратегије у три кључне димензије:


  1. Кашњење наспрам постојаности – Контексту којем се често приступа (нпр. активним стањима задатка) треба да се налази складиште са малим кашњењем, док мање често потребно, али суштинско знање (нпр. историјске интеракције) треба да се преузима на захтев из дуготрајног складиштења.


  2. Структурирани насупрот неструктурираним подацима – Задаци, циљеви и стања система имају користи од структурираног складиштења (нпр. базе података кључ/вредност или документа), док шире проналажење знања захтева неструктурисана уграђивања и односе графова да би се ефикасно ухватио контекст.


  3. Свест у реалном времену у односу на историјску свест – Неки контексти захтевају континуирано праћење (нпр. живи АПИ одговори), док други (нпр. претходне одлуке или извештаји) треба да се преузимају само када су релевантни за тренутни задатак агента.


С обзиром на ове различите типове контекста, АИ агентима је потребан структуриран приступ чувању и приступу информацијама. Ослањање само на прозоре контекста ЛЛМ је неефикасно, јер ограничава способност агента да прати дугорочне интеракције и ситуације које се развијају. Уместо тога, контекст треба стално да се чува, динамички преузима и даје му приоритет на основу релевантности и хитности.


  • Примарни контекст (задаци и циљеви) – Чува се у трансакционим базама података за структурирано праћење и референцира у сваком циклусу закључивања.


  • Директан контекст (стање система и активни подаци) – Одржава се у реалном времену кроз кеширање, складиштење временских серија или ажурирања заснована на догађајима.


  • Спољни контекст (знање и динамичка ажурирања) – упити се на захтев преко векторске претраге, генерисања са проширеним проналажењем (РАГ) или представљања знања заснованог на графу.


У пракси, за скалабилне архитектуре АИ агената потребни су вишеслојни меморијски модели који комбинују краткорочне кеш меморије, трајне базе података и екстерне механизме преузимања. Користећи хибридни приступ складиштењу, АИ агенти могу:


  • Одржавајте свест о активним системима у реалном времену .
  • Преузми историјско знање само када је релевантно.
  • Динамички прилагођавајте приоритете на основу потреба које се развијају.


Интеграцијом ових стратегија складиштења, АИ агенти могу функционисати аутономно, задржати контекстуалну свест током дугих периода и динамички реаговати на нове информације – постављајући основу за заиста интелигентне и скалабилне агентске системе.

Хибридна решења за складиштење

Имплементација хибридне архитектуре складиштења за АИ агенте захтева одабир правих база података и алата за складиштење за ефикасно руковање различитим типовима контекста. Најбољи избор зависи од фактора као што су захтеви за кашњење, скалабилност, компатибилност структуре података и механизми преузимања.


Добро дизајниран систем складиштења АИ агената обично укључује:

  • Трансакцијске базе података за структурирано, трајно праћење задатака.
  • Временске серије и складиште вођено догађајима за праћење стања система у реалном времену.
  • Векторска претрага и проналажење знања за флексибилан, неструктурирани приступ подацима.
  • Кеширање и базе података у меморији за брз приступ краткорочној меморији.


Хајде да детаљније погледамо сваки од ових елемената.

Трансакционе и дистрибуиране базе података

АИ агенти захтевају скалабилне, високо доступне трансакционе базе података за поуздано складиштење задатака, циљева и структурираних метаподатака. Ове базе података обезбеђују да је примарни контекст увек доступан и да се може ефикасно испитивати.


  • Апацхе Цассандра® – Дистрибуирана НоСКЛ база података дизајнирана за високу доступност и толеранцију грешака. Идеално за управљање структурираним листама задатака и праћење циљева агента у великом обиму.


  • ДатаСтак Астра ДБ Управљана база података као услуга (ДБааС) изграђена на Цассандри, пружајући еластичну скалабилност и репликацију у више региона за АИ апликације које захтевају високу издржљивост.


  • ПостгреСКЛ – Популарна релациона база података са јаким гаранцијама конзистентности, добро прилагођена за метаподатке структурисаних агената, сталне евиденције задатака и спровођење политике.

Временске серије и складиште вођено догађајима

За праћење система у реалном времену, АИ агентима су потребне базе података оптимизоване за евидентирање, праћење догађаја и постојаност стања.

  • ИнфлукДБ – Водећа база података временских серија дизајнирана за брзо унос и ефикасне упите, што је чини идеалном за евидентирање активности АИ агента и екстерних ажурирања система.


  • ТимесцалеДБ – ПостгреСКЛ екстензија оптимизована за радна оптерећења временских серија, погодна за праћење промена у радним токовима АИ агента и системским догађајима.


  • Апацхе Кафка + кСКЛДБ – платформа за стриминг података која омогућава АИ агентима да ефикасно конзумирају, обрађују и реагују на догађаје у реалном времену.


  • Редис Стреамс – Лагано решење за руковање догађајима у реалном времену и чекање порука, корисно за обавештавање агената вештачке интелигенције о новим ажурирањима када се догоде.

Вецтор Сеарцх фор Кновледге Ретриевал

Агенти вештачке интелигенције који раде са неструктурираним знањем захтевају ефикасне начине за складиштење, претрагу и преузимање уграђених елемената за задатке као што су семантичка претрага, подударање сличности и генерисање са проширеним проналажењем (РАГ). Добро оптимизован систем векторске претраге омогућава агентима да се присете релевантних прошлих интеракција, докумената или чињеница без преоптерећења меморије или прозора контекста.


  • ДатаСтак Астра ДБ – скалабилна, управљана векторска база података изграђена на Цассандри, која нуди претрагу сличности високих перформанси и мултимодално проналажење. Астра комбинује дистрибуирану отпорност са могућностима векторске претраге, што је чини врхунским избором за АИ агенте који морају ефикасно да обрађују уградње, истовремено обезбеђујући глобалну скалабилност и високу доступност.


  • Веавиате – Векторска база података заснована на облаку дизајнирана за семантичку претрагу и мултимодално проналажење података. Подржава хибридне методе претраживања и добро се интегрише са графовима знања, што га чини корисним за АИ агенте који се ослањају на контекстуално резоновање.


  • ФАИСС (Фацебоок АИ Симиларити Сеарцх) – библиотека отвореног кода за претрагу најближих суседа високих перформанси, често уграђена у АИ цевоводе за брзо тражење вектора на великим скуповима података. Иако није потпуна база података, ФАИСС пружа лагано решење велике брзине за локалну претрагу сличности.

Кеширање и складиштење у меморији

АИ агенти захтевају приступ са малим кашњењем често референцираном контексту, чинећи кеширање суштинском компонентом хибридних архитектура складиштења.


  • Редис – Складиште кључ-вредност у меморији високих перформанси, које се широко користи за краткорочно кеширање контекста и управљање сесијом у АИ агентима.


  • Мемцацхед – Једноставан, али ефикасан дистрибуирани систем кеширања који обезбеђује брз приступ често коришћеним подацима АИ агента.


Интеграцијом ових разноврсних решења за складиштење, АИ агенти могу ефикасно да управљају краткорочном меморијом, постојаним знањем и ажурирањима у реалном времену, обезбеђујући беспрекорно доношење одлука у великом обиму. Комбинација трансакционих база података, складиштења временских серија, векторске претраге и кеширања омогућава агентима да уравнотеже брзину, скалабилност и контекстуалну свест, динамички се прилагођавајући новим улазима.


Како апликације вођене вештачком интелигенцијом настављају да се развијају, одабир праве хибридне архитектуре складиштења биће од кључног значаја за омогућавање аутономних, брзих и интелигентних агентских система који могу поуздано да раде у сложеним и стално променљивим окружењима.

Будућност АИ агената са хибридним базама података

Како системи вештачке интелигенције буду све сложенији, хибридне базе података ће бити кључне за управљање краткорочном и дугорочном меморијом, структурираним и неструктурираним подацима и увидима у реалном времену и историјским подацима. Напредак у генерисању са проширеним проналажењем (РАГ), семантичком индексирању и дистрибуираном закључивању чини агенте вештачке интелигенције ефикаснијим, интелигентнијим и прилагодљивијим. Будући АИ агенти ће се ослањати на брзу, скалабилну и контекстуалну меморију како би одржали континуитет и донели информисане одлуке током времена.

Зашто хибридне базе података?

АИ агентима су потребна решења за складиштење која ефикасно управљају различитим типовима контекста истовремено обезбеђујући брзину, скалабилност и отпорност. Хибридне базе података нуде најбоље из оба света – структуриране податке велике брзине са дубоким контекстуалним проналажењем – што их чини темељним за интелигентне системе вештачке интелигенције. Они подржавају претрагу засновану на векторима за дуготрајно складиштење знања, трансакцијске претраге са малим кашњењем, ажурирања у реалном времену заснована на догађајима и дистрибуирану скалабилност за толеранцију грешака.

Изградња скалабилне инфраструктуре АИ података

Да би подржали интелигентне АИ агенте, програмери би требало да дизајнирају архитектуре складиштења које комбинују више модела података за беспрекорно управљање контекстом:

  • Векторска претрага и колонски подаци – чувајте семантички контекст поред структурираних метаподатака за брзо проналажење

  • Токови посла вођени догађајима – стримујте ажурирања у реалном времену како бисте агенте вештачке интелигенције били свесни промене података

  • Глобални обим и отпорност – примените на дистрибуираним мрежама за високу доступност и толеранцију грешака


Интеграцијом трансакцијске обраде, векторске претраге и ажурирања у реалном времену, хибридне базе података попут ДатаСтак Астра ДБ пружају оптималну основу за меморију АИ агената, свест о контексту и доношење одлука. Како се апликације вођене вештачком интелигенцијом развијају, хибридна решења за складиштење ће бити од суштинског значаја за омогућавање аутономних, контекстуално богатих АИ агената који поуздано раде у динамичким окружењима са интензивним подацима.


Написао Бриан Годсеи, ДатаСтак