Az energiaalapú érvelési modellek a nagyobb pontosság érdekében kihívják az auto-regresszív szűkkeresztmetszetet

2026. február 24. · MI Történik? · 1 perc olvasás

Nem a Mercury 2 az egyetlen, amely megkérdőjelezi az autoregresszív paradigmát. A Logical Intelligence – melyet Eve Bodnia alapított, a technikai kutatótanács elnöke pedig Yann LeCun – olyan energiaalapú érvelési modelleket épít, amelyek egy másik gyengeséget, a korlátok közötti pontosságot célozzák meg. Amíg a diffúziós modellek a sebesség érdekében holisztikusan generálják és finomítják a szöveget, az energiaalapú modellek pontozzák a részleges érvelési folyamatokat, hogy gondolat közben csípjék el a hibákat, mintha egy beépített tényellenőrzőként működnének. Kona nevű modelljük 96%-ot ért el a Sudoku benchmarkokon, ahol az LLM-ek mindössze 2%-ot, Aleph nevű orchestrációs rendszerük pedig a PutnamBench formális matematikai érvelési benchmark 99,4%-át oldotta meg.

Az energiaalapú modellek (EBM-ek) pontozzák a részleges érvelési nyomvonalakat a hibák azonosítása és menet közbeni javítása érdekében.
A Kona modell 96%-os eredményt ért el Sudoku teszteken, szemben a standard LLM-ek 2%-ával.
Az Aleph orchestrációs rendszer a PutnamBench matematikai benchmark 99,4%-át teljesítette.
Ez a megközelítés ellenőrizhető érvelést és szinte azonnali hibahely-meghatározást tesz lehetővé.
A diffúzióval kombinálva ezek a modellek 30-50-szer gyorsabb érvelési ciklusokat eredményezhetnek matematikai garanciák mellett.

Miért fontos?

Mind a diffúziós, mind az energiaalapú modellek elutasítják a jelenlegi AI egy-token-per-lépés alapú szűkkeresztmetszetét. Míg a diffúzió sebességet és hatékonyságot kínál, az energiaalapú modellek ellenőrizhető érvelést biztosítanak, ami a jelenlegi költségek töredékéért vezethet sokkal gyorsabb és pontosabb AI rendszerekhez.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Text-to-Video képességek javulnak a Runway Gen-2 béta verziójának fejlődésével

2026. május 23.

Személyi stylist ruhatár-munkafolyamat

most

Bejelentették a FLUX 3-at multimodális videó- és hangpredikcióval

2 órája

Tudj meg többet

AI modellek finomhangolása és egyedi fejlesztése: Lépj túl a generikus megoldásokon!

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?