MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az új ARC-AGI-2 benchmark a készségek elsajátításában hívja ki az AI-t

Az Arc Prize Foundation bemutatta az ARC-AGI-2-t, egy új benchmarkot, amely azt méri, mennyire jól képes az AI új készségeket elsajátítani. Míg az emberek 100%-ot értek el a teszten, a legjobb reasoning modellek még a 4%-ot sem tudják túllépni. Ez azért van, mert a teszt nem a puszta memorizálást értékeli; ehelyett a modelleknek „legalább némi tudatos gondolkodásra” kell hagyatkozniuk a helyes válaszadáshoz.
Eredeti forrás megtekintése (angol) →