A DeepMind JAX-támogatással és deformálható testekkel frissítette a MuJoCo fizikai szimulátort

2023. október 23. · MI Történik? · 1 perc olvasás

A Google DeepMind számos frissítést hajtott végre a MuJoCo-n, a robotok tanítására szolgáló ingyenes fizikai szimulátoron, amelyet 2021-ben vásárolt meg.

Mik a frissítések? Gyors szimuláció JAX-en keresztül: A frissítések tartalmazzák a JAX-en keresztül gyorsított szimuláció támogatását. Konkrétan van egy MuJoCo XLA modul, amely lehetővé teszi a váltást a CPU-k, GPU-k és TPU-k között. „Az MJX-ben futó szimulációk általában ugyanúgy futnak majd, mint a MuJoCo-ban, és az MJX-szel tanított gépi tanulási modellek is ugyanúgy fognak működni a MuJoCo-ban” – írja a DeepMind, különösen látványos gyorsulást említve a Google saját TPU-in.

Különleges formák: Mostantól sokkal különlegesebb formákat, például fogaskerekeket, anyákat és csavarokat is létrehozhatunk a MuJoCo-ban. „A MuJoCo 3 támogatást ad a Signed Distance Function-ökön (SDF) alapuló ütközési geometriákhoz, lehetővé téve a felhasználók számára, hogy új primitíveket hozzanak létre bármely adott hely és a felület legközelebbi pontja közötti távolság meghatározásával.”

Lágy anyagok: Kiterjesztették a deformálható objektumok lehetőségeit is a „flex” nevű deformálható testtípus hozzáadásával. „Ezek szegmensek (1D), háromszögek (2D) és tetraéderek (3D) gyűjteményei, amelyek megfelelnek a kötélnek, a szövetnek és az olyan deformálható volumetrikus formáknak, mint a biológiai szövetek.”

Bevezeti a MuJoCo XLA-t (MJX) a GPU-kon és TPU-kon történő gyorsított szimulációhoz.
Támogatást adott a Signed Distance Function-ökhöz (SDF), hogy összetett geometriákat, például fogaskerekeket lehessen létrehozni.
Az új „flex” testtípus lehetővé teszi 1D, 2D és 3D deformálható objektumok szimulációját.
A flexibilis testek képesek zárt hurkú struktúrák, például gumiszalagok vagy pólók szimulálására.
Utat nyit az összetett viselkedésmódok szimulációban történő tanításához a valós világba való átültetés előtt.

Miért fontos?

A MuJoCo az egyik legszélesebb körben használt platform az RL-ágensek fejlesztésére, szimulálására és tanítására. Ezekkel a frissítésekkel az összetett dolgok szélesebb skálája válik szimulálhatóvá, ami azt jelenti, hogy a) jobb ágenseket kapunk, és b) képesek leszünk bonyolultabb viselkedésformákat szimulációban tanítani, mielőtt a megtanult irányelveket átvinnénk a (drága) valós világba, robotokra telepítve.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az XPeng vezérigazgatója irányítja a humanoid robotok sorozatgyártását

most

A Mondo Robotics bemutatta Benit, az autonóm kamerarobotot tartalomgyártók számára

8 órája

A Booster Robotics humanoidja falat is átütő rúgással debütált a futballbemutatón

11 órája