MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Kutatási benchmarkok kérdőjelezik meg a jelenlegi AI ágensek valódi önállóságát

Új értékelések teszik próbára a modern AI eszközök ágens-alapú („agentic”) állításait. Egy nemrégiben megjelent, „12-Factor Agents” című tanulmány szerint a legtöbb jelenlegi AI ágens nem rendelkezik elegendő önállósággal a valós világ összetettségének kezeléséhez. Egy másik érdekes benchmark, a „Vending-Bench” azt vizsgálta, hogy az AI képes-e sikeresen menedzselni egy automata-üzlet logisztikáját és működését, és jelentős hiányosságokat talált a jelenlegi képességekben.

Miért fontos?

Ahogy az iparág a „chatbotoktól” az „ágensek felé” mozdul el, az objektív benchmarkok megléte a tényleges autonómia és megbízhatóság mérésére kulcsfontosságú a vállalati adaptációhoz.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Hatalmas szivárgás: saját fejlesztésű AI System Promptok jelentek meg a GitHubon
2025. április 22.
A Google kiadta a Gemma 3 kvantált változatait lakossági GPU-kra
2025. április 22.
Jelentős frissítések a Cursor IDE-ben, miközben kiszivárogtak a védett LLM system promptok
2025. április 22.