Az új ARC-AGI-2 benchmark a készségek elsajátításában hívja ki az AI-t

2025. március 25. · MI Történik? · 1 perc olvasás

Az Arc Prize Foundation bemutatta az ARC-AGI-2-t, egy új benchmarkot, amely azt méri, mennyire jól képes az AI új készségeket elsajátítani. Míg az emberek 100%-ot értek el a teszten, a legjobb reasoning modellek még a 4%-ot sem tudják túllépni. Ez azért van, mert a teszt nem a puszta memorizálást értékeli; ehelyett a modelleknek „legalább némi tudatos gondolkodásra” kell hagyatkozniuk a helyes válaszadáshoz.

Az ARC-AGI-2 a készségek elsajátítására fókuszál az adatmemorizálás helyett.
Az emberi tesztelők 100%-ot érnek el, míg a jelenlegi frontier AI modellek 4% alatt teljesítenek.
A benchmark megköveteli a modellektől a tudatos gondolkodást az új típusú problémák megoldásához.
--

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az Anthropic elindította az Ode-ot, egy önálló vállalati AI-szolgáltató céget

11 órája

A Weco AI kísérleti bizonyítékot közölt az autonóm rekurzív önfejlesztésre

tegnap

Az SK Hynix 26,5 milliárd dollárt gyűjtött rekordot döntő amerikai tőzsdei bevezetésével

2 napja

Tudj meg többet

Vektor Adatbázisok és RAG (Retrieval-Augmented Generation): Így teheted okosabbá és naprakészebbé az AI-t

AI adatbiztonság és adatvédelem: Hogyan használd az AI-t biztonságosan?