MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A vezető AI modellek elbuknak az ARC-AGI-3 érvelési és tanulási teszten

Sikeres vizsgák: Az AI modellek már sikeresen teljesítették a könyvvizsgálói vizsgát, a jogi szakvizsgát és más, közismerten nehéz teszteket. Azonban az ARC-AGI-3 interaktív érvelési teszt szerint az AI-ból még mindig hiányzik egy kritikus képesség: a tanulás képessége. Videójátékok: Az ARC-AGI-3 teszt utasítások, szabályok vagy célok nélkül dobja be az AI modelleket egy videójáték-szintre – arra kényszerítve őket, hogy maguktól jöjjenek rá, hogyan kell játszani és hogyan lehet hatékonyan nyerni. A legtöbb ember könnyen megoldja a feladatot. De a vezető modellek? Nem igazán. A Gemini, a Claude, a ChatGPT és a Grok mind 1% alatt teljesített. Tudáshézag: A mai legfejlettebb modellek lényegében elképesztő memorizáló gépek. Hatalmas adathalmazokon tanították őket, majd ezt az információt gyorsan előhívják a természetes nyelvű kérdések megválaszolásához. De a memorizálás nem egyenlő a gondolkodással. Ezért képes az AI átmenni egy olyan nehéz vizsgán, amire kiképezték – de küzd egy új videójáték-szinttel.

Miért fontos?

Az eredmények rávilágítanak arra, hogy a mai AI modellek inkább fejlett memorizáló eszközök, semmint olyan entitások, amelyek képesek valódi, független érvelésre és tanulásra újszerű környezetekben.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Poseidon Aerospace bemutatta az Egretet, a világ legnagyobb teherszállító drónját
most
A Mondo Robotics bemutatta Benit, az autonóm kamerarobotot tartalomgyártók számára
most
A Unitree humanoid robotja meghódított egy 20 000 láb magas vulkánt Ecuadorban
most
Tudj meg többet
Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?