MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az energiaalapú érvelési modellek a nagyobb pontosság érdekében kihívják az auto-regresszív szűkkeresztmetszetet

Nem a Mercury 2 az egyetlen, amely megkérdőjelezi az autoregresszív paradigmát. A Logical Intelligence – melyet Eve Bodnia alapított, a technikai kutatótanács elnöke pedig Yann LeCun – olyan energiaalapú érvelési modelleket épít, amelyek egy másik gyengeséget, a korlátok közötti pontosságot célozzák meg. Amíg a diffúziós modellek a sebesség érdekében holisztikusan generálják és finomítják a szöveget, az energiaalapú modellek pontozzák a részleges érvelési folyamatokat, hogy gondolat közben csípjék el a hibákat, mintha egy beépített tényellenőrzőként működnének. Kona nevű modelljük 96%-ot ért el a Sudoku benchmarkokon, ahol az LLM-ek mindössze 2%-ot, Aleph nevű orchestrációs rendszerük pedig a PutnamBench formális matematikai érvelési benchmark 99,4%-át oldotta meg.

Miért fontos?

Mind a diffúziós, mind az energiaalapú modellek elutasítják a jelenlegi AI egy-token-per-lépés alapú szűkkeresztmetszetét. Míg a diffúzió sebességet és hatékonyságot kínál, az energiaalapú modellek ellenőrizhető érvelést biztosítanak, ami a jelenlegi költségek töredékéért vezethet sokkal gyorsabb és pontosabb AI rendszerekhez.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Text-to-Video képességek javulnak a Runway Gen-2 béta verziójának fejlődésével
2026. május 23.
A Mondo Robotics bemutatta Benit, az autonóm kamerarobotot tartalomgyártók számára
1 órája
A Booster Robotics humanoidja falat is átütő rúgással debütált a futballbemutatón
3 órája
Tudj meg többet
Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?