MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A MuJoCo Playground leegyszerűsíti a sim-to-real megerősítéses tanulást a robotikai kutatásokban

Az UC Berkeley, a Google DeepMind, a University of Toronto és a University of Cambridge kutatói továbbfejlesztették a MuJoCo-t, a széles körben használt robotikai szimulátort. Konkrétan megalkották a MuJoCo Playground-ot, amely „egy teljesen open-source keretrendszer a robotok tanításához, amelyet a sim-to-real megerősítéses tanulási szabályrendszerek gyors iterációjára és telepítésére terveztek”. A MuJoCo Playground a MuJoCo XLA-ra épül, amely a MuJoCo JAX-alapú, GPU-kon futó ága. Bár ez sok mozaikszó, a lényeg, hogy a MuJoCo Playground rendkívül gyorsan fut a számos optimalizációnak köszönhetően. Tartalmaz továbbá egy sor környezetet a robotok tanításához, valamint az open-source Madrona batch GPU renderelőt, hogy megkönnyítse a látásalapú robotok szimulációs oktatását. A MuJoCo Playground használatának fő oka az, ha robotokat vezérlő AI-rendszereket tanítasz, és némi egyszerűségre vágysz: „Az egyszerű telepítési folyamatnak (pip install playground) és a platformfüggetlen támogatásnak köszönhetően a felhasználók gyorsan taníthatnak modelleket egyetlen GPU-n. A teljes folyamat – a környezet beállításától a szabályrendszer optimalizálásáig – futtatható egyetlen Colab notebookban, a legtöbb feladat pedig mindössze néhány percnyi tanítási időt igényel” – írják a kutatók.
Miért fontos?

Az AI és a robotika metszete egy hosszú tél után most éli virágkorát. Ennek oka háromrétű: 1) számos nagy teljesítményű és néha egészen olcsó robot megjelenése, 2) a megerősítéses tanulás beérése, így relatíve könnyű megtanítani a robotokat mozogni és látni szimulációban, majd ezt átültetni a valóságba, és 3) a számítási teljesítmény fejlődése, ami azt jelenti, hogy az egyetlen modern GPU-ban rejlő erő elegendő az alapvető rendszerek tanításához. Mindent összevetve arra számíthatunk, hogy az AI-robotika egy szórakoztató „homebrew computer club” korszakba lép, ahol sokan kezdenek el olcsó robotokat tanítani vicces vagy hasznos dolgokra. ---

Eredeti forrás megtekintése (angol) →