A DeepMind JAX-támogatással és deformálható testekkel frissítette a MuJoCo fizikai szimulátort
A Google DeepMind számos frissítést hajtott végre a MuJoCo-n, a robotok tanítására szolgáló ingyenes fizikai szimulátoron, amelyet 2021-ben vásárolt meg.
Mik a frissítések? Gyors szimuláció JAX-en keresztül: A frissítések tartalmazzák a JAX-en keresztül gyorsított szimuláció támogatását. Konkrétan van egy MuJoCo XLA modul, amely lehetővé teszi a váltást a CPU-k, GPU-k és TPU-k között. „Az MJX-ben futó szimulációk általában ugyanúgy futnak majd, mint a MuJoCo-ban, és az MJX-szel tanított gépi tanulási modellek is ugyanúgy fognak működni a MuJoCo-ban” – írja a DeepMind, különösen látványos gyorsulást említve a Google saját TPU-in.
Különleges formák: Mostantól sokkal különlegesebb formákat, például fogaskerekeket, anyákat és csavarokat is létrehozhatunk a MuJoCo-ban. „A MuJoCo 3 támogatást ad a Signed Distance Function-ökön (SDF) alapuló ütközési geometriákhoz, lehetővé téve a felhasználók számára, hogy új primitíveket hozzanak létre bármely adott hely és a felület legközelebbi pontja közötti távolság meghatározásával.”
Lágy anyagok: Kiterjesztették a deformálható objektumok lehetőségeit is a „flex” nevű deformálható testtípus hozzáadásával. „Ezek szegmensek (1D), háromszögek (2D) és tetraéderek (3D) gyűjteményei, amelyek megfelelnek a kötélnek, a szövetnek és az olyan deformálható volumetrikus formáknak, mint a biológiai szövetek.”
- Bevezeti a MuJoCo XLA-t (MJX) a GPU-kon és TPU-kon történő gyorsított szimulációhoz.
- Támogatást adott a Signed Distance Function-ökhöz (SDF), hogy összetett geometriákat, például fogaskerekeket lehessen létrehozni.
- Az új „flex” testtípus lehetővé teszi 1D, 2D és 3D deformálható objektumok szimulációját.
- A flexibilis testek képesek zárt hurkú struktúrák, például gumiszalagok vagy pólók szimulálására.
- Utat nyit az összetett viselkedésmódok szimulációban történő tanításához a valós világba való átültetés előtt.
Miért fontos?
A MuJoCo az egyik legszélesebb körben használt platform az RL-ágensek fejlesztésére, szimulálására és tanítására. Ezekkel a frissítésekkel az összetett dolgok szélesebb skálája válik szimulálhatóvá, ami azt jelenti, hogy a) jobb ágenseket kapunk, és b) képesek leszünk bonyolultabb viselkedésformákat szimulációban tanítani, mielőtt a megtanult irányelveket átvinnénk a (drága) valós világba, robotokra telepítve.