1,354 čítania
1,354 čítania

Znalostné grafy môžu byť tým chýbajúcim článkom, ktorý firmy potrebujú na umelú inteligenciu, ktorá funguje

podľa George Anadiotis14m2025/03/14
Read on Terminal Reader

Príliš dlho; Čítať

Organizácie čelia kritickej výzve pre prijatie AI: ako využiť svoje znalosti špecifické pre danú doménu na používanie AI spôsobom, ktorý prináša dôveryhodné výsledky. Znalostné grafy poskytujú chýbajúcu „vrstvu pravdy“ pre AI, ktorá transformuje pravdepodobnostné výstupy na zrýchlenie podnikania v reálnom svete.
featured image - Znalostné grafy môžu byť tým chýbajúcim článkom, ktorý firmy potrebujú na umelú inteligenciu, ktorá funguje
George Anadiotis HackerNoon profile picture
0-item
1-item
2-item


Organizácie čelia kritickej výzve pre prijatie AI: ako využiť svoje znalosti špecifické pre danú doménu na používanie AI spôsobom, ktorý prináša dôveryhodné výsledky. Znalostné grafy poskytujú chýbajúcu „vrstvu pravdy“ pre AI, ktorá transformuje pravdepodobnostné výstupy na zrýchlenie podnikania v reálnom svete.

🚀 Prijatie AI sa zrýchľuje, no väčšina implementácií neprináša očakávanú obchodnú hodnotu

• 🔍 Znalostné grafy poskytujú základnú „vrstvu pravdy“ pre spoľahlivé systémy AI

• 🔄 Pragmatická AI kombinuje kreatívny potenciál LLM s možnosťami overovania znalostných grafov

Úvod

„Kontext je to, čo dáva význam takmer všetkému. Takže v tomto rozsahu majú všetky grafy vlastný potenciál priniesť viac vedomostí alebo významu, pretože už urobili prvý krok k uznaniu vzájomnej prepojenosti a kontextuálnej povahy informácií.


Žijeme vo svete, ktorému dominuje AI a veľké jazykové modely (LLM) a ukazuje sa, že kontext a význam sú nevyhnutné na to, aby sme z nich získali kvalitné výsledky. Znalostné grafy môžu byť kľúčom k poskytnutiu kontextu a zmyslu na odomknutie potenciálu AI a dôkazy, ktoré to podporujú, pribúdajú.


Pri príležitosti vydania najnovšieho cyklu Gartner Hype pre umelú inteligenciu viceprezidentka pre výskum, AI v Gartner Svetlana Sicular poznamenala , že investície do AI dosiahli nové maximum so zameraním na generatívnu AI. Vo väčšine prípadov to však ešte neprinesie očakávanú obchodnú hodnotu.


Znalostné grafy sú jadrom technológií Critical Enabler v zozname nových technológií spoločnosti Gartner, ktoré môžu lídri zvážiť ako súčasť svojej stratégie. Gartner odporúča znalostné grafy ako kľúčové pri vytváraní a zlepšovaní modelov GenAI. Organizácie ako Amazon a Samsung používajú znalostné grafy a očakáva sa, že trh do roku 2030 vzrastie na 6,93 miliardy dolárov s CAGR 36,6 % .


Gartner už niekoľko rokov obhajuje úlohu znalostných grafov v AI a následné efekty v organizáciách, pretože ani technológia, ani vízia nie sú nové. Technológia znalostných grafov existuje už desaťročia a ľudia ako Tony Seale čoskoro identifikovali jej potenciál ako pravdivej vrstvy pre AI.

Seale, tiež známy ako „The Knowledge Graph Guy“, je zakladateľom rovnomennej poradenskej firmy. Vyššie uvedený citát je prevzatý z rozsiahlej konverzácie, ktorá zahŕňa všetko od základných princípov znalostného grafu až po aplikačné vzory pre bezpečnú, overiteľnú AI, reálne skúsenosti, trendy, predpovede a cestu vpred.

🧠 Grafy znalostí a kontext AI

• Napriek značným investíciám do AI musí väčšina organizácií ešte dodať očakávanú obchodnú hodnotu

• Kontext a význam sú nevyhnutné pre kvalitné výsledky AI

• Znalostné grafy poskytujú kľúčovú kontextovú vrstvu pre systémy AI

• Znalostné grafy sú rozhodujúcimi faktormi pre konkurenčnú stratégiu GenAI

Od dátových síl po prepojené údaje a znalostné grafy

Seale má desaťročia skúseností s prácou s údajmi vo finančných inštitúciách Tier 1. Asi pred desiatimi rokmi pracoval na „ďalšom projekte ETL “ pre veľkú investičnú banku, prenášal údaje do dátového skladu a implementoval dátové kanály. Toto je typický prístup k uspokojovaniu potrieb organizačných správ a dodržiavania predpisov. Problém je v tom, že sa neškáluje a nepomáha pridať kontext a význam .


Potom Seale narazil na prednášku Tima Bernersa Leeho na TED v roku 2010 o Linked Data a to všetko zmenilo. V roku 2010 sa spoločnosť Google len dostávala do znalostných grafov a tento výraz sa v skutočnosti neobjavil . Ale technológia tam bola pod názvom Linked Data. Prednáška TBL na TED stačila na to, aby Seale pochopil 2 kľúčové princípy Linked Data a začal s nimi experimentovať ako s alternatívou k ETL.


Základnou myšlienkou Linked Data je aplikovať všeobecnú architektúru World Wide Web na úlohu zdieľania štruktúrovaných dát v globálnom meradle. To, o čo ide, je používanie identifikátorov HTTP pre údaje, aby sa dali vyhľadať, a poskytovanie informácií o ich význame (sémantika) pomocou štandardov.

Seale pochopil, že ak decentralizovaná povaha tohto prístupu môže fungovať pre web, môže fungovať pre akúkoľvek organizáciu. Namiesto toho, aby mali jeden centrálny bod integrácie a kontroly, čo je de facto prístup ETL projektov a dátových skladov, znalostné grafy umožňujú škálovanie prostredníctvom decentralizácie a štandardov.


Toto sú rovnaké princípy, vďaka ktorým funguje web. Niet divu, že vynálezca webu ho chcel posunúť na ďalšiu úroveň a prejsť z webu dokumentov na sieť údajov. Okrem prístupu k údajom však tento prístup pridáva do mixu aj sémantiku. Dátové body, ako aj prepojenia medzi nimi môžu mať špecifický význam a typy, ktoré sú k nim pripojené.


Najlepším príkladom sémantiky v praxi vo webovom meradle je schema.org . Schema.org je výsledkom spoločného úsilia o definovanie štandardnej slovnej zásoby, ktorú používa 30 % všetkých webových stránok a 72,6 % stránok na prvej stránke Google . Okrem definovania sémantiky pomocou štandardov umožňuje schema.org anotáciu a integráciu škálovateľnú prostredníctvom decentralizácie .

🌐 Základy prepojených dát

• Linked Data aplikuje princípy webovej architektúry na zdieľanie štruktúrovaných dát

• Používa HTTP identifikátory, aby bolo možné systematicky vyhľadávať údaje

• Poskytuje informácie o význame (sémantike) pomocou noriem

• Umožňuje organizačný rozsah prostredníctvom decentralizácie

• Schema.org je príkladom sémantických štandardov vo webovom meradle

Umelá inteligencia sa stretáva s grafmi znalostí

Schema.org je to, čo umožňuje Google na celom svete zostavovať svoje znalostné grafy a dávať väčší zmysel webu . Je to rovnaký prístup, s ktorým sa Seale prvýkrát začal pohrávať ako projekt pod stolom v investičnej banke, pre ktorú v tom čase pracoval a očakával, že zlyhá. To nie.


Povzbudený počiatočným úspechom sa Seale stal vášnivým zástancom znalostných grafov a inicioval množstvo súvisiacich projektov. Presťahoval organizácie v snahe o svoju vášeň a hľadal grafové neurónové siete ako spôsob, ako naštartovať sémantiku a anotáciu potrebnú na vytváranie znalostných grafov, keď boli vydané prvé veľké jazykové modely GPT.


Seale začal experimentovať s LLM a čoskoro sa presvedčil o dvoch veciach. Po prvé, že LLM budú mať obrovský vplyv. Po druhé, že LLM sa dokonale hodia k znalostným grafom. Začal zdieľať svoje nápady na LinkedIn a stal sa virálnym. Nakoniec si vytvoril vlastnú poradenskú spoločnosť a teraz pracuje na ich implementácii s množstvom klientov.

„Všetky organizácie budú musieť akceptovať realitu, že sa presúvame do pravdepodobnejšieho sveta. Takže každý musí začať používať AI, inak pravdepodobne skončíte. Presúvame sa do tohto nového sveta, kde veci budú pravdepodobnostné a AI bude súčasťou mnohých rozhodovacích procesov.


Možno sa ti to nebude páčiť alebo môžeš mať akýkoľvek názor, ale to je jedno. Je to nejaká sila prírody, ktorá sa deje, takže by ste si na to mohli zvyknúť. Takže potom naozaj znie otázka, no, ako to urobiť bezpečným spôsobom. A podľa môjho názoru to prichádza cez externé overenie, “povedal Seale.


To je jadro prístupu, ktorý presadzuje. Zahŕňa vzory s vymyslenými názvami, ako napríklad graf pracovnej pamäte a neurónovo-symbolická slučka, a príklady od DeepSeek po projekt Cyc. Ale predtým, ako sa do nich ponoríme, stojí za to sa na chvíľu zastaviť, aby sme sa uzemnili na prvých princípoch.

🤖 Integrácia AI a znalostného grafu

• LLM a znalostné grafy sa dopĺňajú

• Smerujeme k pravdepodobnostnému svetu, v ktorom bude AI súčasťou rozhodovania

• Externé overenie prostredníctvom znalostných grafov vytvára bezpečnejšiu AI

• Organizácie sa musia tomuto posunu prispôsobiť

Prvé princípy: Grafy a znalostné grafy

Čím sa teda grafy líšia od iných dátových štruktúr a čím sa grafy znalostí líšia od ostatných grafov? Môžeme k tomu pristupovať na úrovni implementácie alebo na úrovni prvých princípov.


Bez ohľadu na to, či hovoríme o tabuľkovom procesore vs. myšlienkovej mape, o riadkoch a stĺpcoch relačnej databázy vs. o uzloch a okrajoch databázy grafov, alebo o teórii množín verzus teória grafov, existuje jedna vec, ktorá odlišuje graf od seba: spojenia ako prvotriedni občania. Ale nie všetky grafy sa kvalifikujú ako znalostné grafy .


Uzly aj hrany v grafe môžu byť rôznych typov. Jednoduchý graf môže obsahovať uzly reprezentujúce produkty a hrany reprezentujúce všeobecný typ vzťahu medzi nimi. Bipartitný graf môže mať dva rôzne typy uzlov, ktoré predstavujú produkty a zákazníkov, a hrany predstavujúce, ktorý zákazník si kúpil aký produkt.


Heterogénny graf môže mať najrôznejšie typy uzlov a hrán. Napríklad uzly predstavujúce produkty a zákazníkov a hrany predstavujúce, ktorý zákazník si kúpil aký produkt a ktorý produkt bol hodnotený ktorým zákazníkom.


V grafoch je užitočnosť aj na najjednoduchšej možnej úrovni. Grafové algoritmy ako hľadanie cesty a centralita môžu byť mimoriadne užitočné pre aplikácie a analýzy a nevyžadujú heterogénne grafy.

Používanie URI ako identifikátorov a zdieľaná slovná zásoba a dohodnutá schéma sú definujúcimi znakmi znalostných grafov.


„Akonáhle začnete hovoriť, no, vlastne, nie, niektoré z týchto uzlov sú odlišné veci a hrany medzi nimi, sú to špeciálne odlišné typy hrán, ktoré niečo znamenajú, potom zložitosť stúpa. Povaha algoritmov, ktoré môžete spustiť, vrátane algoritmov strojového učenia, sa mení. Myslím, že by sme to mohli nazvať vstupnou úrovňou k tomu, čo je znalostný graf,“ poznamenal Seale.


Všimnite si časť „vstupná úroveň“. Je tu dlhá a komplikovaná história, siahajúca až do začiatku 20. storočia a sémantického webu . Práve na týchto nápadoch, štandardoch a technickom balíku stavali princípy Linked Data. „Sémantický web“ zanikol, zatiaľ čo „Knowledge Graph“ sa uchytil.


Sémantický web pravdepodobne predbehol svoju dobu. Mnohé implementačné snahy boli nesprávne a jeho zástancovia neboli vždy pragmatickí. Ako však poznamenal Seale, neurónové siete boli tiež dlho považované za prepadák. Používanie URI ako identifikátorov a zdieľaná slovná zásoba a dohodnutá schéma zostávajú charakteristickými znakmi znalostných grafov a hodnotou, ktorú môžu priniesť.

📊 Základy grafu

• Grafy sa odlišujú od iných dátových štruktúr tým, že s prepojeniami zaobchádzajú ako s prvotriednymi občanmi

• Nie všetky grafy sa kvalifikujú ako znalostné grafy

• Znalostné grafy dodávajú uzlom a hranám sémantický význam

• URI ako identifikátory a zdieľané slovníky definujú vlastnosti znalostných grafov

Nepretržitý svet a diskrétny svet

Štruktúra a sémantika, ktorú znalostné grafy prinášajú, umožňujú veci, ktoré s inými dátovými typmi alebo dokonca inými grafmi jednoducho nie sú možné. Seale je presvedčený, že každá organizácia by mala pracovať na svojej vlastnej verzii schema.org a používať ju na anotovanie svojich údajov, vytváranie znalostných grafov na podporu svojej AI.


Seale použil DeepSeek ako príklad na vysvetlenie prístupu overovateľa. Rovnako ako všetci ostatní, aj Seale bol posadnutý DeepSeek a snažil sa prísť na to, čo urobili. Odhliadnuc od šikovných algoritmov a optimalizácií, jadrom úspechu DeepSeek je skutočnosť, že na posilnenie učenia použili overiteľné údaje: matematiku a kód .


„Zobrali všetky webové údaje, ako to robí každý. Ale potom vytiahli len kúsky súvisiace s matematikou a kódovaním. Pomocou toho môžete vytvoriť externý overovateľ.


Môžete sa pozrieť na matematiku alebo kód, potom sa môžete pozrieť na odpoveď na konci a môžete skontrolovať, či je odpoveď skutočne správna. Potom to môžete odovzdať LLM a požiadať LLM, aby to urobil, a potom to porovnať s externým formálnym overovateľom. To, čo robí, je, že pridáva kontrolu kvality k pravdepodobnostnému modelu,“ vysvetlil Seale.

Kontinuálne a diskrétne prístupy k reprezentácii znalostí majú zreteľné výhody a obmedzenia


Seale potom rozpracoval to, čo nazýva súvislý svet a diskrétny svet . V nepretržitom svete je všetko pravdepodobnostné, všetko je nejasné, a to je miesto, kde sú tieto generatívne modely AI. Jedna vec sa prelína s druhou a máte halucinácie. Ale odvrátená strana toho, podľa Seala, je, že je tam niečo ako kreativita.


V staromódnom svete AI existuje legenda projektu Cyc . Cyc je mimoriadne ambiciózny projekt AI, ktorého cieľom je zakódovať všeobecné znalosti o svete formálnym spôsobom. Seale má veľký rešpekt pred Cyc. Poznamenal však, že Cyc neuspel a nemohol uspieť, zatiaľ čo generatívne modely AI áno – svojím vlastným spôsobom. Ale majú svoje vlastné nevýhody.


Generatívnym modelom AI nemožno dôverovať, a preto sú nevhodné na podnikové prijatie v oblastiach, ako sú financie, právo alebo medicína. V prípade domén, ako je matematika alebo kód, je možné formálne overiť výsledky. Čo keby existoval spôsob, ako to urobiť aj v iných doménach? Seale si myslí, že existuje, a kľúčom sú znalostné grafy a ontológia.

🌓 Nepretržitý vs. diskrétny svet

• Nepretržitý svet: pravdepodobnostný, nejasný, kreatívny, ale náchylný na halucinácie (LLM)

• Diskrétny svet: logický, formálny, overiteľný, ale obmedzený (tradičná AI)

• V prípade matematiky alebo kódu môžu byť výsledky formálne overené

• Znalostné grafy a ontológie môžu poskytnúť overenie pre iné domény

Vzostup ontológie

Spomenuli sme schema.org, ako aj všeobecný pojem schéma. Schémy sú zvyčajne spojené s relačnými databázami , kde definujú štruktúru a organizáciu údajov. Grafy môžu mať aj schémy. Schémy pre znalostné grafy sa nazývajú ontológie, hoci slovo „schéma“ v skutočnosti nezodpovedá ontológiám .


Ontológie idú nad rámec schém tým, že umožňujú modelovanie konštruktov, ako sú hierarchie dedičnosti alebo logické axiómy. Môžu zachytiť nielen štruktúru a organizáciu údajov, ale aj veci, ako sú obchodné pravidlá a znalosti domény.


„Názov hry je priblížiť sa čo najbližšie k sémantike podnikania. Snažíte sa vziať slová, ktoré obchodníci používajú v rámci danej organizácie, a premeniť ich na tieto formálne koncepty, aby ste boli skutočne konkrétni o tom, čo sú, a potom tieto koncepty prepojiť tak, aby sa navzájom spájali so špecifickými typmi hrán,“ vysvetlil Seale.


Záujem o znalostné grafy a ontológiu vrcholí


Budovanie ontológie nie je jednoduché. Vyžaduje si prístup k doménovým znalostiam, ktoré sú zvyčajne rozptýlené, čiastočne zdokumentované a pochopené a medzi odborníkmi sú sporné. Vyžaduje si to aj odbornosť v oblasti ontologického modelovania a správne nástroje.


To je dôvod, prečo aj keď ontologické modelovanie existuje už desaťročia , nikdy sa v skutočnosti nepresadilo v hlavnom prúde. Seale si však myslí, že sa to mení a na podporu toho môžu existovať nejaké nepriame dôkazy.


V Trendoch Google zaznamenal „Knowledge Graph“ za posledných 5 rokov nárast o 3,450 %. Vo vyhradenom úložisku Roku grafu sa odkazy na ontológiu od roku 2022 viac ako zdvojnásobili, a to z hľadiska množstva aj rozmanitosti zdrojov. Navyše, Sealeov vlastný úspešný príbeh sa stáva príkladom virality vedomostných grafov.

📚 Rastúci význam ontológie

• Ontológie idú nad rámec schém tým, že vytvárajú formálne koncepty z obchodnej terminológie

• Cieľ: Presne zachytiť obchodnú sémantiku a vzťahy

• Vyžaduje znalosť domény a odbornosť v oblasti ontologického modelovania

• Google Trends ukazuje, že „Knowledge Graph“ vzrástol za 5 rokov o 3 450 %.

Neurónovo-symbolická slučka

Existuje obojsmerný vzťah znalostných grafov a ontológií s LLM. LLM môžu pomôcť rozvoju ontológie a znalostného grafu populácie. Spoločnosť Seale uviedla, že má na tento účel dobré skúsenosti s používaním LLM, ale váš počet najazdených kilometrov sa môže líšiť. V každom prípade sú tieto nástroje určené na podporu odborníkov, nie na úplnú automatizáciu úlohy.


Skutočne zaujímavé to však začína byť naopak: ontológie a znalostné grafy pôsobiace ako overovateľ, v podstate vrstva pravdy, pre LLM. Seale to nazýva vzor grafu pracovnej pamäte pre LLM .


V grafe pracovnej pamäte ontológia destiluje doménové znalosti a znalostný graf slúži ako databáza špecifická – a súkromná – pre organizáciu. LLM fungujú ako sprostredkovatelia a pridávajú časť prieskumu a tvorivosti, pričom tiež poskytujú prístup k neštruktúrovaným znalostiam. Môžu to byť všeobecné znalosti získané v LLM alebo znalosti špecifické pre danú oblasť prostredníctvom RAG .

Vo vzore neurónovo-symbolickej slučky sa LLM a znalostné grafy navzájom dopĺňajú


Graf pracovnej pamäte je súčasťou väčšieho vzoru, ktorý Seale nazýva Neural-Symbolic Loop . V tomto funguje graf pracovnej pamäte ako overovateľ domén, kde je overenie potrebné. Cieľom je umožniť pre každú doménu to, čo je možné pre matematiku alebo kód: overiť správnosť výsledkov generovaných LLM.


Je zrejmé, že je to oveľa ťažšie dosiahnuť v oblastiach mimo matematiky alebo kódu. Úsilie a odborné znalosti potrebné na vytvorenie ontológií a znalostných grafov zostávajú značné a výsledky nemusia byť také jednoznačné. Ale dá sa to urobiť a Seale je presvedčený, že je to najlepšia cesta k vrstve pravdy pre AI.

🔄 Prístup neurónovej symbolickej slučky

• Začnite so znalosťami domény špecifickými pre vašu organizáciu

• Vytvorte ontológiu na formalizáciu týchto znalostí

• Vytvorte znalostný graf ako súkromnú databázu vašej organizácie

• Využite LLM ako sprostredkovateľov pre objavovanie a kreativitu

• Použite graf pracovnej pamäte ako overovaciu vrstvu

• Vytvorte nepretržitú slučku overovania a zlepšovania

Pragmatický prístup AI: Od teórie k implementácii

"AI je vypnutá ako raketa." Nikto nemôže urobiť takmer nič, aby to zastavil. Aj tak sa to deje. Takže v každej organizácii sa ocitnete v situácii, keď budete môcť importovať túto všeobecnú inteligenciu. Momentálne je to inteligentné, možno nie superinteligentné, ale v priebehu nasledujúcich 5 až 10 rokov sa to podarí.


Máte toto krátke okno. Čo musíte urobiť, je preniesť AI do kontextu našej organizácie a sústrediť sa na spodok ľadovca AI, ktorým sú dáta. Takže musíte vziať silu, ktorú máte v modeloch, ktoré máte práve teraz v rukách, a zamerať ju späť na dáta, ktoré tam máte.


Údaje musíte vyčistiť a skonsolidovať, aby boli v stave efektívneho externého overovateľa. Musíte si byť vedomí toho, aké informácie majú hodnotu 0 001 USD a aké informácie máte len vy a akú hodnotu pridávate. Musíte to urobiť teraz, pretože to je jediná hra v meste, pokiaľ vidím,“ povedal Seale.


Seale tiež zdieľal množstvo predpovedí na rok 2025 : kríza údajov, znalostné grafy ako základ dátovej štruktúry, GraphRAG prostredníctvom ontológií a aproximácia formálneho uvažovania uvažovaním LLM. Ak chcete o nich podrobne hovoriť, pozrite si epizódu podcastu. Celkovo si Seale myslí, že AI je z krátkodobého hľadiska masívne prehnaná, no z dlhodobého hľadiska výrazne poddimenzovaná.


Seale pracuje na aplikácii znalostných grafov a ontológií pre organizácie, ktoré sú na to pripravené. To však niečo stojí a nedá sa to prispôsobiť každému. Navyše, žiadna konzultačná spoločnosť nikdy nebude schopná urobiť všetko vzdelávanie alebo prácu so základnými údajmi, ktoré sú pre vás potrebné.


Pragmatická umelá inteligencia premosťuje túto medzeru vzdelávaním o princípoch na prvom mieste, správe, správe, modelovaní a vede o údajoch. Znalosti domény, ktoré sú jedinečné pre organizácie, potom možno využiť na vybudovanie systémov AI na základe dôveryhodných a overených údajov.

Pragmatické školenie AI

Teória a praktické laboratóriá. All-inclusive útočisko. Kohorta s obmedzeným počtom miest.

Kliknite sem a zaregistrujte sa na Pragmatic AI Training

Kurz Pragmatic AI poskytuje vedúcim pracovníkom, manažérom, podnikateľom, konzultantom a kreatívcom základné znalosti a praktické znalosti potrebné na budovanie systémov AI, ktoré prinášajú skutočnú obchodnú hodnotu. Začnite so základmi a získajte náskok pri vytváraní pravdivej vrstvy vašej organizácie a získajte konkurenčnú výhodu v ére AI.


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks