MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az LLM-ek alulmúlják az emberi teljesítményt az új játék benchmarkban

Az MIT, a Harvard, a Brit Kolumbiai Egyetem, a Princetoni Egyetem, a Cambridge-i Egyetem és a Valènciai Műszaki Egyetem kutatói létrehozták és kiadták az AI GAMESTORE-t, egy benchmarkot, amely azt teszteli, mennyire jól teljesítenek az AI-k az emberekhez képest az egyszerű webes játékok játszásában. Az eredmények meglehetősen elítélőek az AI rendszerekre nézve, mivel „a state-of-the-art modellek átlagosan az emberi baseline kevesebb mint 30%-át érik el, miközben 15-20-szor több időt igényelnek a compute-hoz, mint az emberek”.
Miért fontos?

Miért fontos ez – this is both an interesting benchmark, és a clever way to generate more benchmarkokat in the future: A GAMESTORE feels like a promising benchmark, especially for modern LLM-ek, amelyek wrap in visual capabilities, as well as an inherently clever way to use AI-kat to bootstrap the creation of new environmentekben, amikben to train AI systems in.

Eredeti forrás megtekintése (angol) →