MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az energiaalapú érvelési modellek a nagyobb pontosság érdekében kihívják az auto-regresszív szűkkeresztmetszetet

Nem a Mercury 2 az egyetlen, amely megkérdőjelezi az autoregresszív paradigmát. A Logical Intelligence – melyet Eve Bodnia alapított, a technikai kutatótanács elnöke pedig Yann LeCun – olyan energiaalapú érvelési modelleket épít, amelyek egy másik gyengeséget, a korlátok közötti pontosságot célozzák meg. Amíg a diffúziós modellek a sebesség érdekében holisztikusan generálják és finomítják a szöveget, az energiaalapú modellek pontozzák a részleges érvelési folyamatokat, hogy gondolat közben csípjék el a hibákat, mintha egy beépített tényellenőrzőként működnének. Kona nevű modelljük 96%-ot ért el a Sudoku benchmarkokon, ahol az LLM-ek mindössze 2%-ot, Aleph nevű orchestrációs rendszerük pedig a PutnamBench formális matematikai érvelési benchmark 99,4%-át oldotta meg.
Miért fontos?

Mind a diffúziós, mind az energiaalapú modellek elutasítják a jelenlegi AI egy-token-per-lépés alapú szűkkeresztmetszetét. Míg a diffúzió sebességet és hatékonyságot kínál, az energiaalapú modellek ellenőrizhető érvelést biztosítanak, ami a jelenlegi költségek töredékéért vezethet sokkal gyorsabb és pontosabb AI rendszerekhez.

Eredeti forrás megtekintése (angol) →