A MuJoCo Playground leegyszerűsíti a sim-to-real megerősítéses tanulást a robotikai kutatásokban

2025. február 17. · MI Történik? · 2 perc olvasás

Az UC Berkeley, a Google DeepMind, a University of Toronto és a University of Cambridge kutatói továbbfejlesztették a MuJoCo-t, a széles körben használt robotikai szimulátort. Konkrétan megalkották a MuJoCo Playground-ot, amely „egy teljesen open-source keretrendszer a robotok tanításához, amelyet a sim-to-real megerősítéses tanulási szabályrendszerek gyors iterációjára és telepítésére terveztek”.

A MuJoCo Playground a MuJoCo XLA-ra épül, amely a MuJoCo JAX-alapú, GPU-kon futó ága. Bár ez sok mozaikszó, a lényeg, hogy a MuJoCo Playground rendkívül gyorsan fut a számos optimalizációnak köszönhetően. Tartalmaz továbbá egy sor környezetet a robotok tanításához, valamint az open-source Madrona batch GPU renderelőt, hogy megkönnyítse a látásalapú robotok szimulációs oktatását.

A MuJoCo Playground használatának fő oka az, ha robotokat vezérlő AI-rendszereket tanítasz, és némi egyszerűségre vágysz: „Az egyszerű telepítési folyamatnak (pip install playground) és a platformfüggetlen támogatásnak köszönhetően a felhasználók gyorsan taníthatnak modelleket egyetlen GPU-n. A teljes folyamat – a környezet beállításától a szabályrendszer optimalizálásáig – futtatható egyetlen Colab notebookban, a legtöbb feladat pedig mindössze néhány percnyi tanítási időt igényel” – írják a kutatók.

A MuJoCo XLA-ra, egy JAX-alapú, GPU-n futó ágra épül.
Tartalmazza a Madrona batch GPU renderelőt a látásalapú tanításhoz.
Lehetővé teszi a teljes tanítási folyamatok futtatását egyetlen Colab notebookban, percek alatt.
Támogatja az olyan robotok lokomócióját (helyváltoztatását), mint a Unitree Go1, a Boston Dynamics Spot és a Unitree H1/G1.
Támogatja a manipulációs feladatokat a Leap Hand, a Franka Emika Panda és az Aloha robotok esetében.

Miért fontos?

Az AI és a robotika metszete egy hosszú tél után most éli virágkorát. Ennek oka háromrétű: 1) számos nagy teljesítményű és néha egészen olcsó robot megjelenése, 2) a megerősítéses tanulás beérése, így relatíve könnyű megtanítani a robotokat mozogni és látni szimulációban, majd ezt átültetni a valóságba, és 3) a számítási teljesítmény fejlődése, ami azt jelenti, hogy az egyetlen modern GPU-ban rejlő erő elegendő az alapvető rendszerek tanításához. Mindent összevetve arra számíthatunk, hogy az AI-robotika egy szórakoztató „homebrew computer club” korszakba lép, ahol sokan kezdenek el olcsó robotokat tanítani vicces vagy hasznos dolgokra. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az 5-szintes AI jártassági modell teljesen kezdőknek

2026. április 2.

Hogyan használjuk a Dispatch-et a számítógép távoli vezérlésére a Claude segítségével

2026. március 25.

Hogyan használd a Claude-ot AI tárhelytisztító segédpilótaként

2026. március 24.