A Diffbot modell egy billió tényt tartalmazó tudásgráfból merít a pontosság növelése érdekében

2026. május 25. · MI Történik? · 2 perc olvasás

A szilícium-völgyi Diffbot startup egy egészen új megközelítéssel hívta fel magára a figyelmet az AI-fejlesztés világában, miután kifejlesztett egy egyedülálló rendszert. A vállalat csendben felépítette az internet egyik legnagyobb tudásindexét, amely több mint egy billió tényt tartalmaz. Ezt a hatalmas adatbázist a weboldalak autonóm lekaparásával és a rajtuk található tartalom strukturált rendszerezésével hozták létre. Az így kapott tudásgráf rendkívüli előnyt biztosít a cég számára a piacon, mivel az új modelljük képes közvetlenül felidézni a pontos információkat ahelyett, hogy egyszerűen csak a következő valószínű szövegrészt jósolná meg.

A technológiai hátteret vizsgálva a Diffbot egy olyan új modellt mutatott be, amely a Meta nyílt forráskódú Llama 3.3 alapjaira épül, de egy rendkívül lényeges ponton eltér attól. A kulcsfontosságú különbség a piacon elérhető hagyományos LLM verziókhoz képest az, hogy ez a rendszer egyfajta enciklopédikus memóriával rendelkezik. Míg a legtöbb nagy nyelvi modell csupán statisztikai alapon jósolja meg a következő sort egy adott szövegsorozatban, a Diffbot LLM-je képes a valós időben történő működése során konkrét tényeket kikeresni és felhasználni a hatalmas adatkészletéből. Ez a működési elv alapjaiban változtatja meg az információfeldolgozást, hiszen a modell közvetlenül a megbízható adatokból táplálkozik.

Ez a forradalmi módszer közvetlen és hatékony megoldást kínál az AI-iparág egyik legnagyobb kihívására, a hallucinációra. Mivel a Diffbot rendszere a valós időben lekérdezett, ellenőrzött tényekre támaszkodik, sokkal kevesebb téves információt generál, mint a versenytársai. A folyamat leginkább ahhoz hasonlítható, mintha a múltbeli valós tapasztalatokat és rögzített adatokat idézné fel a gép ahelyett, hogy valami teljesen újat találna ki csupán a szöveg folyamatosságának biztosítása érdekében. Ennek az egyedi struktúrának köszönhetően a startup újdonsága a mai napig a világ legtényszerűbben megalapozott modelljének tekinthető.

De miért is bír olyan hatalmas jelentőséggel ez a fejlesztés a tech szektor számára a jelenlegi helyzetben? A Diffbot megközelítése mindössze 1B paramétert használ, ami rendkívül alacsonynak és kompaktnak számít a mai óriásmodellek korában. Ennek ellenére ez a módszer pontosabbnak és lényegesen hatékonyabbnak bizonyul a hagyományos, pusztán a méret növelésére építő eljárásokhoz képest. Ahogy az AI-iparág világszerte egyre inkább beleütközik a komoly energia- és adatkorlátokba, ez a rendkívül hatékony és tényalapú technológia valódi, méltó alternatívát kínál a jövőbeli fejlesztések számára.

A startup épp most mutatott be egy új modellt, amely a Meta nyílt forráskódú Llama 3.3 modelljére épül, de egy kulcsfontosságú különbséggel: enciklopédikus memóriával rendelkezik
Míg a legtöbb modell a következő sort jósolja meg egy szövegsorozatban, a Diffbot LLM-je valós időben képes konkrét tényeket kikeresni a hatalmas adatkészletéből
Ez a módszer sokkal kevesebb hallucinációhoz vezet – olyan, mintha a múltbeli tapasztalatokat idézné fel, ahelyett, hogy valami teljesen újat generálna –, így a mai napig a „világ legtényszerűbben megalapozott” modellje

Miért fontos?

Mindössze 1B paramétert használva ez a megközelítés pontosabbnak és hatékonyabbnak bizonyulhat a hagyományos módszerekhez képest, méltó alternatívát kínálva, ahogy az iparág az energia- és adatkorlátokba ütközik.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az IBM vezérigazgatója szerint az AI-infrastruktúra kiépítése hátrányosan érinti a vállalati szoftvereladásokat

18 órája

Az OpenAI hordozható, okos AI-hangszórót dobna piacra

1 napja

A PrismML bemutatta az eddigi legnagyobb, iPhone-on futtatható AI-modellt

1 napja

Tudj meg többet

AI modellek finomhangolása és egyedi fejlesztése: Lépj túl a generikus megoldásokon!

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?