1,354 aflæsninger
1,354 aflæsninger

Vidensgrafer kan være det manglende led, som virksomheder har brug for for en AI, der virker

ved George Anadiotis14m2025/03/14
Read on Terminal Reader

For langt; At læse

Organisationer står over for en kritisk udfordring for AI-adoption: hvordan man kan udnytte deres domænespecifikke viden til at bruge AI på en måde, der leverer pålidelige resultater. Videngrafer giver det manglende "sandhedslag" for AI, der transformerer sandsynlighedsdata til virkelige forretningsacceleration.
featured image - Vidensgrafer kan være det manglende led, som virksomheder har brug for for en AI, der virker
George Anadiotis HackerNoon profile picture
0-item
1-item
2-item


Organisationer står over for en kritisk udfordring for AI-adoption: hvordan man kan udnytte deres domænespecifikke viden til at bruge AI på en måde, der leverer pålidelige resultater. Vidensgrafer giver det manglende "sandhedslag" for AI, der transformerer sandsynlighedsresultater til virkelige forretningsacceleration.

🚀 AI-adoption accelererer, men de fleste implementeringer leverer ikke forventet forretningsværdi

• 🔍 Vidensgrafer giver det væsentlige "sandhedslag" for pålidelige AI-systemer

• 🔄 Pragmatisk AI kombinerer LLM'ers kreative potentiale med vidensgrafers verifikationsmuligheder

Indledning

”Kontekst er det, der giver mening til stort set alt. Så i den grad har alle grafer det iboende potentiale til at bringe mere viden eller mening, fordi de allerede har taget det første skridt med at anerkende informationernes sammenkobling og kontekstuelle karakter”.


Vi lever i en verden domineret af kunstig intelligens og store sprogmodeller (LLM'er), og det viser sig, at kontekst og mening er afgørende for at få kvalitetsresultater ud af dem. Vidensgrafer kan indeholde nøglen til at give kontekst og mening for at frigøre AI's potentiale, og beviserne til støtte for dette er stigende.


I anledning af udgivelsen af den seneste Gartner Hype Cycle for Artificial Intelligence bemærkede Research VP, AI hos Gartner Svetlana Sicular, at investeringer i AI nåede et nyt højdepunkt med fokus på generativ AI. Men i de fleste tilfælde har dette endnu ikke leveret den forventede forretningsværdi.


Knowledge Graphs er kernen i Critical Enabler-teknologier på Gartners liste over nye teknologier, som ledere kan overveje som en del af deres strategi. Gartner anbefaler videngrafer som værende kritiske i opbygningen og fremme af GenAI-modeller. Organisationer som Amazon og Samsung bruger vidensgrafer, og markedet forventes at vokse til 6,93 milliarder dollars i 2030 ved en CAGR på 36,6 % .


Gartner har de sidste par år talt for vidensgrafernes rolle i AI i dag og downstream-effekterne i organisationer fremadrettet, da hverken teknologien eller visionen er ny. Knowledge graph-teknologi har eksisteret i årtier , og folk som Tony Seale var tidlige til at identificere dets potentiale som et sandhedslag for AI.

Seale, også kendt som "The Knowledge Graph Guy", er grundlæggeren af det eponyme konsulentfirma. Ovenstående citat er taget fra en omfattende samtale, der dækker alt fra vidensgrafens første principper til anvendelsesmønstre for sikker, verificerbar AI, erfaringer fra den virkelige verden, tendenser, forudsigelser og vejen frem.

🧠 Vidensgrafer og AI-kontekst

• På trods af betydelige AI-investeringer har de fleste organisationer endnu ikke leveret forventet forretningsværdi

• Kontekst og mening er afgørende for AI-resultater af høj kvalitet

• Vidensgrafer udgør det afgørende kontekstlag for AI-systemer

• Videngrafer er kritiske muligheder for konkurrencedygtig GenAI-strategi

Fra datasiloer til Linked Data og Knowledge Graphs

Seale har årtiers erfaring med at arbejde med data i Tier 1 finansielle institutioner. For omkring ti år siden arbejdede han på "endnu et ETL -projekt" for en stor investeringsbank, hvor han bragte data ind i et datavarehus og implementerede datapipelines. Dette er en typisk tilgang til at tjene organisatoriske rapporterings- og overholdelsesbehov. Problemet er, at det ikke skalerer eller hjælper med at tilføje kontekst og mening .


Så stødte Seale på Tim Berners Lees TED-talk fra 2010 om Linked Data , og det ændrede alt. I 2010 var Google lige begyndt på Knowledge Graphs, og udtrykket var ikke rigtig dukket op . Men teknologien var der under navnet Linked Data. TBL's TED-talk var nok til at få Seale til at forstå de 2 nøgleprincipper i Linked Data, og til at begynde at eksperimentere med dette som et alternativ til ETL.


Den grundlæggende idé med Linked Data er at anvende World Wide Webs generelle arkitektur til opgaven med at dele strukturerede data på globalt plan. Det, det hele handler om, er at bruge HTTP-identifikatorer til data, så de kan slås op, og give information om deres betydning (semantik) ved hjælp af standarder.

Hvad Seale forstod var, at hvis den decentraliserede karakter af denne tilgang kunne fungere for nettet, kunne den fungere for enhver organisation. I stedet for at have ét centralt integrations- og kontrolpunkt, som er de facto-tilgangen til ETL-projekter og datavarehuse, muliggør vidensgrafer skalering gennem decentralisering og standarder.


Det er de samme principper, der får nettet til at fungere. Det er ikke underligt, at opfinderen af nettet ønskede at tage det til næste niveau at gå fra et net af dokumenter til et net af data. Ud over at få adgang til data, tilføjer denne tilgang dog semantik til blandingen. Datapunkter såvel som links mellem dem kan have specifik betydning og typer knyttet til dem.


Det bedste eksempel på semantik i aktion på web-skala er schema.org . Schema.org er et samarbejde om at definere et standardordforråd, der bruges af 30 % af alle websteder og 72,6 % af siderne på den første side af Google . Ud over at definere semantik ved hjælp af standarder, gør schema.org annotering og integration skalerbar via decentralisering .

🌐 Linkede datafonde

• Linked Data anvender webarkitekturprincipper til struktureret datadeling

• Bruger HTTP identifikatorer, så data kan slås systematisk op

• Giver information om betydning (semantik) ved hjælp af standarder

• Muliggør organisatorisk skala gennem decentralisering

• Schema.org eksemplificerer semantiske standarder på web-skala

AI møder Knowledge Graphs

Schema.org er det, der gør det muligt for Googles i verden at bygge deres vidensgrafer og få mere mening ud af nettet . Det er den samme tilgang, som Seale først begyndte at lege med som et projekt under skrivebordet i den investeringsbank, han arbejdede for på det tidspunkt, og forventede, at det ville mislykkes. Det gjorde den ikke.


Opmuntret af den første succes blev Seale en lidenskabelig fortaler for videngrafer og igangsatte en række relaterede projekter. Han flyttede organisationer i jagten på sin passion og undersøgte grafiske neurale netværk som en måde at opstarte den semantik og annotering, der var nødvendig for at bygge vidensgrafer, da de første store GPT-sprogmodeller blev frigivet.


Seale begyndte at eksperimentere med LLM'er og blev hurtigt overbevist om to ting. For det første, at LLM'er vil have en massiv indflydelse. For det andet, at LLM'er er et perfekt match til vidensgrafer. Han begyndte at dele sine ideer på LinkedIn og blev viral. Til sidst dannede han sit eget konsulentfirma og arbejder nu på at implementere disse hos en række kunder.

"Alle organisationer bliver nødt til at acceptere den virkelighed, at vi bevæger os til en mere sandsynlig verden. Så alle er nødt til at begynde at bruge kunstig intelligens, ellers vil du sandsynligvis gå konkurs. Vi flytter til denne nye verden, hvor tingene vil være sandsynlige, og AI vil være indlejret i en stor del af beslutningstagningen.


Du kan måske ikke lide det, eller du kan have en hvilken som helst mening, men det er ligeglad. Det er en eller anden naturkraft, der sker, så man kan lige så godt lige vænne sig til det. Så så bliver spørgsmålet virkelig, ja, hvordan gør man det på en sikker måde. Og efter min mening kommer det gennem ekstern verifikation”, sagde Seale.


Det er kernen i den tilgang, han går ind for. Det inkluderer mønstre med fancy navne, såsom Working Memory Graph og Neural-Symbolic Loop, og eksempler lige fra DeepSeek til Cyc-projektet. Men før du dykker ned i disse, er det værd at holde pause et øjeblik for at basere os på de første principper.

🤖 AI og Knowledge Graph Integration

• LLM'er og vidensgrafer er komplementære

• Vi bevæger os mod en probabilistisk verden, hvor kunstig intelligens vil blive integreret i beslutningstagning

• Ekstern verifikation gennem vidensgrafer skaber sikrere AI

• Organisationer skal tilpasse sig dette skift

Første principper: Grafer og vidensgrafer

Så hvad adskiller grafer sig fra andre datastrukturer, og hvad adskiller vidensgrafer fra andre grafer? Vi kan gribe dette an på implementeringsniveauet eller på det første principniveau.


Uanset om vi taler om et regneark vs. et mindmap, en relationsdatabases rækker og kolonner vs. en grafdatabases noder og kanter, eller mængdeteori vs. grafteori, er der én ting, der adskiller grafen: forbindelser som førsteklasses borgere. Men ikke alle grafer kvalificerer sig som vidensgrafer .


Både noder og kanter i en graf kan være af forskellige typer. En simpel graf kan indeholde noder, der repræsenterer produkter, og kanter, der repræsenterer en generisk type forhold mellem dem. En todelt graf kan have to forskellige typer knudepunkter, der repræsenterer produkter og kunder, og kanter, der repræsenterer, hvilken kunde købte hvilket produkt.


En heterogen graf kan have alle mulige forskellige typer knudepunkter og kanter. For eksempel noder, der repræsenterer produkter og kunder, og kanter, der repræsenterer, hvilken kunde, der købte hvilket produkt, og hvilket produkt, der blev anmeldt af hvilken kunde.


Der er nytte i grafer selv på det enklest mulige niveau. Grafalgoritmer som stifinding og centralitet kan være yderst nyttige til applikationer og analyser og kræver ikke heterogene grafer.

At bruge URI'er som identifikatorer og have et fælles ordforråd og et aftalt skema er de definerende træk ved vidensgrafer


"Når du begynder at sige, ja, faktisk nej, nogle af disse noder er forskellige ting, og kanterne mellem dem, de er specielle forskellige typer kanter, der betyder noget, så stiger kompleksiteten. Arten af de algoritmer, du kan køre, herunder maskinlæringsalgoritmer, ændres. Jeg tror, vi kunne kalde det indgangsniveauet til, hvad en vidensgraf er”, bemærkede Seale.


Bemærk "entry level"-delen. Der er en lang og kompliceret historie her, der går tilbage til begyndelsen af 00'erne og det semantiske web . Det var på disse ideer, standarder og tekniske stakke, som Linked Data-principperne byggede på. "Semantic Web" døde ud, mens "Knowledge Graph" fangede.


Det Semantiske Web var uden tvivl forud for sin tid. Mange implementeringsbestræbelser var forkerte, og dets tilhængere har ikke altid været pragmatiske. Men som Seale bemærkede, blev neurale netværk også betragtet som et flop i lang tid. At bruge URI'er som identifikatorer og have et fælles ordforråd og et aftalt skema forbliver kendetegnende for vidensgrafer og den værdi, de kan bringe.

📊 Graph Fundamentals

• Grafer adskiller sig fra andre datastrukturer ved at behandle forbindelser som førsteklasses borgere

• Ikke alle grafer kvalificerer sig som vidensgrafer

• Vidensgrafer tilføjer semantisk betydning til noder og kanter

• URI'er som identifikatorer og delte ordforråd er definerende træk ved vidensgrafer

Den kontinuerlige verden og den diskrete verden

Den struktur og semantik, som vidensgrafer bringer, muliggør ting, der simpelthen ikke er mulige med andre datatyper eller endda andre grafer. Seale mener, at enhver organisation bør arbejde på deres egen version af schema.org og bruge den til at kommentere deres data og bygge vidensgrafer til at drive deres AI.


Seale brugte DeepSeek som et eksempel til at forklare verifikatortilgangen. Som alle andre var Seale besat af DeepSeek og prøvede at finde ud af, hvad det var, de gjorde. Bortset fra smarte algoritmer og optimeringer, er kernen i DeepSeeks succes det faktum, at de brugte verificerbare data til forstærkende læring: matematik og kode .


"De tog alle webdata, som alle gør. Men så trak de bare de dele ud, der var relateret til matematik og kodning. Med det kan du oprette en ekstern verifikator.


Du kan se på matematikken eller koden, så kan du se på svaret til sidst, og du kan tjekke, om svaret faktisk er rigtigt. Så kan du sende det til LLM'en og bede LLM'en om at gøre det, og derefter tjekke mod den eksterne formelle verifikator. Det, det gør, er, at det tilføjer kvalitetskontrol på den probabilistiske model”, forklarede Seale.

Kontinuerlige og diskrete tilgange til videnrepræsentation har forskellige fordele og begrænsninger


Seale uddybede derefter, hvad han kalder den kontinuerlige verden og den diskrete verden . I den kontinuerlige verden er alt sandsynligt, alt er sløret, og det er her, disse generative AI-modeller er. Det ene går over i det andet, og man får hallucinationer. Men bagsiden af det, ifølge Seale, er, at der er noget, der ligner kreativitet der.


I den gammeldags AI- verden er der legenden om Cyc Project . Cyc er et enormt ambitiøst AI-projekt, der har til formål at indkode generel viden om verden på en formel måde. Seale har stor respekt for Cyc. Han bemærkede dog, at Cyc ikke lykkedes og kunne ikke lykkes, mens generative AI-modeller gør - på deres egen måde. Men de kommer med deres eget sæt af ulemper.


Generative AI-modeller kan ikke stole på, og det gør dem uegnede til virksomhedsadoption inden for domæner som finans, jura eller medicin. For domæner som matematik eller kode er det muligt at bekræfte resultater formelt. Hvad hvis der også var en måde at gøre det på i andre domæner? Seale mener, der er, og nøglerne er vidensgrafer og ontologi.

🌓 Den kontinuerlige vs. diskrete verden

• Kontinuerlig verden: sandsynlighed, sløret, kreativ, men tilbøjelig til hallucinationer (LLM'er)

• Diskret verden: logisk, formel, verificerbar, men begrænset (traditionel kunstig intelligens)

• For matematik eller kode kan resultaterne formelt verificeres

• Videngrafer og ontologier kan give verifikation for andre domæner

Ontologiens fremkomst

Vi har nævnt schema.org, såvel som det generelle begreb om skema. Skemaer er typisk forbundet med relationelle databaser , hvor de definerer strukturen og organiseringen af data. Grafer kan også have skemaer. Skemaer til vidensgrafer kaldes ontologier, selvom ordet "skema" ikke rigtig yder ontologier retfærdighed .


Ontologier går ud over skemaer ved at muliggøre modellering af konstruktioner såsom arvshierarkier eller logiske aksiomer. De kan fange ikke kun strukturen og organiseringen af data, men også ting som forretningsregler og domæneviden.


"Spillets navn er at komme så tæt på virksomhedens semantik, som du overhovedet kan. Du forsøger at tage de ord, som forretningsfolk bruger inden for en given organisation, og omdanne dem til disse formelle koncepter for at blive virkelig specifikke om, hvad de er, og derefter forbinde koncepter sammen på en måde, så de hænger sammen med hinanden med specifikke typer kanter”, forklarede Seale.


Interessen for Knowledge Graphs og ontologi er i top


At bygge en ontologi er ikke let. Det kræver adgang til domæneviden, som typisk er spredt, delvist dokumenteret og forstået og omstridt blandt eksperter. Det kræver også ontologisk modelleringsekspertise og de rigtige værktøjer.


Dette er grunden til, at selvom ontologisk modellering har eksisteret i årtier , har den aldrig rigtig opnået mainstream-adoption. Seale mener dog, at det er ved at ændre sig, og der kan være nogle indicier til støtte for dette.


På Google Trends har "Knowledge Graph" oplevet en stigning på 3,450 % i de sidste 5 år. I Året for Grafens dedikerede repository er referencer til ontologi siden 2022 mere end fordoblet både med hensyn til mængde og variation af kilder. Derudover er Seales egen succeshistorie ved at blive plakatbarnet for viralitet med videngrafer.

📚 Ontologis voksende betydning

• Ontologier går ud over skemaer ved at skabe formelle koncepter fra forretningsterminologi

• Mål: Opfang nøjagtigt forretningssemantik og relationer

• Kræver domæneviden og ontologisk modelleringsekspertise

• Google Trends viser, at "Knowledge Graph" er vokset 3.450 % på 5 år

Den neural-symboliske sløjfe

Der er en to-vejs relation viden grafer og ontologier kan have med LLM'er. LLM'er kan hjælpe med ontologiudvikling og vidensgrafpopulation. Seale rapporterede at have en god oplevelse med at bruge LLM'er til dette, men dit kilometertal her kan variere. Under alle omstændigheder er sådanne værktøjer beregnet til at støtte eksperterne, ikke fuldt ud automatisere opgaven.


Hvor det dog bliver virkelig interessant, er den anden vej rundt: ontologier og vidensgrafer, der fungerer som en verifikator, i det væsentlige et sandhedslag, for LLM'er. Seale kalder dette Working Memory Graph-mønsteret for LLM'er .


I Working Memory Graph destillerer ontologien domæneviden, og vidensgrafen fungerer som en databasespecifik – og privat – for organisationen. LLM'er fungerer som formidlere og tilføjer udforsknings- og kreativitetsdelen og giver også adgang til ustruktureret viden. Dette kan være generel viden destilleret i LLM eller domænespecifik viden via RAG .

I Neural-Symbolic Loop-mønsteret komplementerer LLM'er og Knowledge Graphs hinanden


Working Memory Graph er en del af et større mønster, som Seale kalder Neural-Symbolic Loop . I denne fungerer Working Memory Graph som verifikator for domæner, hvor der er behov for verifikation. Ideen er at gøre det muligt for hvert domæne, hvad der er muligt for matematik eller kode: at verificere rigtigheden af resultater genereret af LLM'er.


Det er klart, at det er meget sværere at opnå i domæner ud over matematik eller kode. Den indsats og den ekspertise, der kræves for at bygge ontologier og videngrafer, er fortsat betydelig, og resultaterne er måske ikke så entydige. Men det kan lade sig gøre, og Seale er overbevist om, at det er den bedste vej til et sandhedslag for AI.

🔄 Den neurale symbolske sløjfetilgang

• Start med domæneviden, der er specifik for din organisation

• Udvikle en ontologi til at formalisere denne viden

• Byg en vidensgraf som din organisations private database

• Brug LLM'er som formidlere til udforskning og kreativitet

• Anvend Working Memory Graph som et verifikationslag

• Skab en kontinuerlig sløjfe af verifikation og forbedring

Den pragmatiske AI-tilgang: Fra teori til implementering

"AI er slukket som en raket. Der er stort set intet, nogen kan gøre for at stoppe det. Det sker alligevel. Så i enhver organisation vil du være i en situation, hvor du vil være i stand til at importere denne generelle intelligens. Det er smart i øjeblikket, måske ikke super smart, men det kommer der i løbet af de næste 5 til 10 år.


Du har dette korte vindue. Det, du skal gøre, er at tage AI til konteksten af vores organisation og koncentrere dig om bunden af AI-isbjerget, som er dataene. Så du skal tage den kraft, du har i de modeller, du har i dine hænder lige nu, og fokusere det tilbage på de data, du har derinde.


Du skal rydde op og konsolidere dataene, så de er i en tilstand til at være en effektiv ekstern verifikator. Du skal være opmærksom på, hvilken information der er $0.001 værd, og hvilken information kun du har, og hvad er den værdi, du tilføjer. Du skal gøre det nu, for det er det eneste spil i byen, så vidt jeg kan se”, sagde Seale.


Seale delte også et tal for forudsigelser for 2025 : datakrisen, vidensgrafer som grundlag for datastruktur, GraphRAG via ontologier og tilnærmelse af formelle ræsonnementer ved ræsonnerende LLM'er. For en dybdegående samtale om disse, tjek podcast-episoden. Samlet set mener Seale, at AI er massivt overhypet på kort sigt, men alligevel massivt underhypet på lang sigt.


Seale arbejder på at anvende vidensgrafer og ontologier til organisationer, der er klar til det. Men det koster, og det kan ikke skaleres for alle. Plus, ingen konsulentvirksomhed vil nogensinde være i stand til at udføre al den uddannelse eller det grundlæggende dataarbejde, der er nødvendigt for dig.


Den pragmatiske AI-tilgang bygger bro over denne kløft ved at uddanne om data først-principper, ledelse, styring, modellering og datavidenskab. Derefter kan domæneviden, der er unik for organisationer, udnyttes til at bygge AI-systemer på et grundlag af troværdige, verificerede data.

Pragmatisk AI-træning

Teori og praktiske laboratorier. Retreat med alt inklusive. Begrænset antal pladser.

Klik her for at tilmelde dig Pragmatic AI Training

Pragmatisk AI-kurset giver ledere, ledere, iværksættere, konsulenter og kreative den grundlæggende viden og praktiske ekspertise, der er nødvendig for at bygge AI-systemer, der leverer reel forretningsværdi. Start med det grundlæggende, og få et forspring med at skabe din organisations sandhedslag og få en konkurrencefordel i AI-æraen.


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks