AI OKTÁTÁS
A MuJoCo Playground leegyszerűsíti a sim-to-real megerősítéses tanulást a robotikai kutatásokban
Az UC Berkeley, a Google DeepMind, a University of Toronto és a University of Cambridge kutatói továbbfejlesztették a MuJoCo-t, a széles körben használt robotikai szimulátort. Konkrétan megalkották a MuJoCo Playground-ot, amely „egy teljesen open-source keretrendszer a robotok tanításához, amelyet a sim-to-real megerősítéses tanulási szabályrendszerek gyors iterációjára és telepítésére terveztek”.
A MuJoCo Playground a MuJoCo XLA-ra épül, amely a MuJoCo JAX-alapú, GPU-kon futó ága. Bár ez sok mozaikszó, a lényeg, hogy a MuJoCo Playground rendkívül gyorsan fut a számos optimalizációnak köszönhetően. Tartalmaz továbbá egy sor környezetet a robotok tanításához, valamint az open-source Madrona batch GPU renderelőt, hogy megkönnyítse a látásalapú robotok szimulációs oktatását.
A MuJoCo Playground használatának fő oka az, ha robotokat vezérlő AI-rendszereket tanítasz, és némi egyszerűségre vágysz: „Az egyszerű telepítési folyamatnak (pip install playground) és a platformfüggetlen támogatásnak köszönhetően a felhasználók gyorsan taníthatnak modelleket egyetlen GPU-n. A teljes folyamat – a környezet beállításától a szabályrendszer optimalizálásáig – futtatható egyetlen Colab notebookban, a legtöbb feladat pedig mindössze néhány percnyi tanítási időt igényel” – írják a kutatók.
- A MuJoCo XLA-ra, egy JAX-alapú, GPU-n futó ágra épül.
- Tartalmazza a Madrona batch GPU renderelőt a látásalapú tanításhoz.
- Lehetővé teszi a teljes tanítási folyamatok futtatását egyetlen Colab notebookban, percek alatt.
- Támogatja az olyan robotok lokomócióját (helyváltoztatását), mint a Unitree Go1, a Boston Dynamics Spot és a Unitree H1/G1.
- Támogatja a manipulációs feladatokat a Leap Hand, a Franka Emika Panda és az Aloha robotok esetében.
Miért fontos?
Az AI és a robotika metszete egy hosszú tél után most éli virágkorát. Ennek oka háromrétű: 1) számos nagy teljesítményű és néha egészen olcsó robot megjelenése, 2) a megerősítéses tanulás beérése, így relatíve könnyű megtanítani a robotokat mozogni és látni szimulációban, majd ezt átültetni a valóságba, és 3) a számítási teljesítmény fejlődése, ami azt jelenti, hogy az egyetlen modern GPU-ban rejlő erő elegendő az alapvető rendszerek tanításához. Mindent összevetve arra számíthatunk, hogy az AI-robotika egy szórakoztató „homebrew computer club” korszakba lép, ahol sokan kezdenek el olcsó robotokat tanítani vicces vagy hasznos dolgokra. ---