AI TECHNOLÓGIA
Az energiaalapú érvelési modellek a nagyobb pontosság érdekében kihívják az auto-regresszív szűkkeresztmetszetet
Nem a Mercury 2 az egyetlen, amely megkérdőjelezi az autoregresszív paradigmát. A Logical Intelligence – melyet Eve Bodnia alapított, a technikai kutatótanács elnöke pedig Yann LeCun – olyan energiaalapú érvelési modelleket épít, amelyek egy másik gyengeséget, a korlátok közötti pontosságot célozzák meg. Amíg a diffúziós modellek a sebesség érdekében holisztikusan generálják és finomítják a szöveget, az energiaalapú modellek pontozzák a részleges érvelési folyamatokat, hogy gondolat közben csípjék el a hibákat, mintha egy beépített tényellenőrzőként működnének. Kona nevű modelljük 96%-ot ért el a Sudoku benchmarkokon, ahol az LLM-ek mindössze 2%-ot, Aleph nevű orchestrációs rendszerük pedig a PutnamBench formális matematikai érvelési benchmark 99,4%-át oldotta meg.
- Az energiaalapú modellek (EBM-ek) pontozzák a részleges érvelési nyomvonalakat a hibák azonosítása és menet közbeni javítása érdekében.
- A Kona modell 96%-os eredményt ért el Sudoku teszteken, szemben a standard LLM-ek 2%-ával.
- Az Aleph orchestrációs rendszer a PutnamBench matematikai benchmark 99,4%-át teljesítette.
- Ez a megközelítés ellenőrizhető érvelést és szinte azonnali hibahely-meghatározást tesz lehetővé.
- A diffúzióval kombinálva ezek a modellek 30-50-szer gyorsabb érvelési ciklusokat eredményezhetnek matematikai garanciák mellett.
Miért fontos?
Mind a diffúziós, mind az energiaalapú modellek elutasítják a jelenlegi AI egy-token-per-lépés alapú szűkkeresztmetszetét. Míg a diffúzió sebességet és hatékonyságot kínál, az energiaalapú modellek ellenőrizhető érvelést biztosítanak, ami a jelenlegi költségek töredékéért vezethet sokkal gyorsabb és pontosabb AI rendszerekhez.