Knowledge graph (znalostný graf)
Čo je knowledge graph?
Knowledge graph (známy aj pod skratkou KG), v slovenskom preklade znalostný graf, je štruktúrovaná databáza, ktorá reprezentuje vzťahy medzi entitami prostredníctvom uzlov a hrán. V kontexte umelej inteligencie slúži na organizovanie a prepájanie informácií spôsobom, ktorý umožňuje strojom lepšie porozumieť kontextu a súvislostiam medzi dátami. Znalostné grafy tvoria základ pre mnohé AI aplikácie, od vyhľadávačov až po konverzačné systémy.
Architektúra znalostných grafov
Základom znalostného grafu sú tri komponenty:
- entity (uzly),
- vzťahy (hrany),
- atribúty.
Entity predstavujú objekty reálneho sveta – osoby, miesta, organizácie alebo koncepty. Vzťahy definujú, ako sú tieto entity navzájom prepojené. Tento model sa často označuje ako trojica (subject-predicate-object), napríklad „Bratislava – je hlavným mestom – Slovensko“.
Znalostný graf je databáza, kde sú informácie uložené ako uzly a vzťahy medzi nimi, nie len ako tabuľky a riadky. Umožňuje prirodzene modelovať vety typu „Firma A vlastní Firmu B“ alebo „Osoba X pracuje v Spoločnosti Y“ a jednoducho pridávať nové typy entít a vzťahov bez prerábania celej schémy, čo je pri klasických relačných databázach podstatne ťažšie.
Využitie v AI systémoch
V oblasti AI sa znalostné grafy používajú predovšetkým na obohatenie jazykových modelov o faktické znalosti. Veľké jazykové modely (LLM) môžu pristupovať k znalostným grafom počas generovania odpovedí, čím sa znižuje riziko halucinácie a zvyšuje presnosť poskytovaných informácií.
Vyhľadávače ako Google využívajú vlastné grafy na zobrazovanie kontextových informácií priamo vo výsledkoch vyhľadávania. Podobne ich používajú systémy pre odporúčanie obsahu, analýzu podvodov vo finančnom sektore alebo biomedicínsky výskum na mapovanie vzťahov medzi génmi, chorobami a liekmi.
…Google Knowledge Graph, spustený v roku 2012, obsahuje miliardy faktov o entitách a ich vzťahoch?
Knowledge graph a jeho obmedzenia
Vybudovanie kvalitného KG vyžaduje značné úsilie pri extrakcii, validácii a údržbe dát. Neúplnosť alebo zastarané informácie môžu negatívne ovplyvniť výstupy AI systémov, ktoré na nich závisia. Pri veľkom objeme dát môže byť náročné udržiavať konzistenciu a riešiť konflikty medzi rôznymi zdrojmi informácií.
Zdroje a odkazy
Použité zdroje:
- Google – Introducing the Knowledge Graph: https://blog.google/products/search/introducing-knowledge-graph-things-not/
Odporúčané zdroje:
- IBM Think – What is a knowledge graph?: https://www.ibm.com/think/topics/knowledge-graph
Uvedené informácie sú orientačné a môžu sa líšiť v závislosti od verzie, implementácie a prostredia.