A DeepMind kifejlesztette a SIMA ágenst virtuális világokban történő utasításkövetéshez
A DeepMind a nagy nyelvi modellek eredményeit felhasználva létrehozta a Scalable Instructable Multiworld Agent (SIMA) nevű ágenst – egy RL ágenst, amely képes ~600 különböző műveletet végrehajtani számos különböző szimulált világban. „A SIMA egy olyan AI ágens, amely képes érzékelni és megérteni a különféle környezeteket, majd lépéseket tenni egy utasításban megadott cél elérése érdekében” – írja a DeepMind. „Az AI ágensünknek nincs szüksége a játék forráskódjára, sem egyedi API-kra. Mindössze két bemenetet igényel: a képernyőn látható képeket és a felhasználó által megadott egyszerű, természetes nyelvű utasításokat.”
A SIMA egy olyan adathalmazra támaszkodik, amely játékmenet-bemutatókból és írott utasításokból áll. Ezek az adatok olyan formában jelennek meg, ahol a játékosok más játékosokat instruálnak, vagy narrálják saját tevékenységeiket. Ezt az adathalmazt táplálják be az ágensbe, amely egy kép-enkódert (SPARC) és egy videó-enkódert (Phenaki), valamint egy szöveg-enkódert használ az adatok feldolgozásához egy transformer modellben, amely megtanulja ezeket billentyűzet- és egérkimenetekké leképezni.
- Az ágens nyers pixelek és természetes nyelvű utasítások alapján hajt végre feladatokat.
- Az adathalmaz 6 népszerű játékot (köztük a No Man's Sky-t és a Goat Simulator-t), valamint kutatási környezeteket foglal magában.
- A rendszer előre tanított enkódereket (SPARC és Phenaki) használ finomhangolással.
- Az általános ágensek felülteljesítették az egyetlen játékra tanított speciális ágenseket.
- Jelenleg a tíz másodpercnél rövidebb ideig tartó készségekre korlátozódik.
Miért fontos?
Ez azért működik, mert az ágens képes a rá bízott feladatokról általános koncepcionális reprezentációt alkotni, és ezt a reprezentációt alkalmazni változatos, olykor korábban nem látott környezetekben is. Ez azt jelenti, hogy a DeepMind rájött, hogyan kapcsolja össze a különböző környezeteket a különféle utasításokkal olyan köztes reprezentációkon keresztül, amelyek természetes módon alkalmazhatók új helyzetekben. ---