AI KUTATÁS
Az Apple robusztus önvezető autó irányelveket fejlesztett ki tömeges szimulációs önjátszással
Az Apple kutatói intelligens önvezető autó AI-rendszereket tanítottak be kizárólag önjátszás (self-play) útján, több millió kilométernyi vezetési tapasztalatot szerezve teljesen szimulált környezetben. A „GigaFlow” nevű rendszert használva az Apple bebizonyította, hogy a szimulált önjátszás természetes és robusztus vezetési irányelveket eredményez, miközben minimális jutalmazási függvényt használ, és a tanítás során soha nem látott emberi adatokat. A legimpozánsabb, hogy az így létrejött AI-rendszerek felülteljesítik a legmodernebb rendszereket számos olyan kihívást jelentő benchmark teszten is, amelyekkel a szimuláció során nem találkoztak.
A GigaFlow egy olyan szoftver, amely lehetővé teszi a kutatók számára, hogy hatékonyan szimuláljanak összetett világokat több mint száz szimulált autóval és gyalogossal különböző térképeken. Egy teljes tanítási folyamat több mint egybillió állapotátmenetet szimulál, ami 9500 évnyi szubjektív vezetési tapasztalatnak felel meg, és kevesebb mint 10 nap alatt befejeződik egyetlen 8-GPU-s csomóponton. Az eredmény egy robusztus irányelv, amely állami szintű teljesítményt ér el rögzített, valós forgatókönyvekben.
- A GigaFlow a városi környezeteket 360 000-szer gyorsabban szimulálja a valós időnél.
- A szimulációs költség kevesebb mint 5 dollár egymillió levezetett kilométerenként.
- A rendszer véletlenszerűen módosított (méretezés, nyírás, tükrözés) térképeken tanítja az ágenseket.
- A nuPlan tesztekben az irányelv mindössze 15 ütközést produkált 1118 forgatókönyv során, amelyek nagy részét szenzorzaj vagy elkerülhetetlen ágensviselkedés okozta.
- A Waymax tesztekben az ütközéseknek csak 2,7%-át tekintették a GigaFlow irányelve által elkövetettnek és elkerülhetőnek.
Miért fontos?
Ez a kutatás megmutatja, hogy ha sikerül módot találni nagy mennyiségű adat megszerzésére egy feladathoz, a fő munka az adatok betáplálása egy egyszerű neurális hálóba, a többit pedig rábízhatjuk a rendszerre. Bebizonyítja, hogy a robusztus, emberszerű vezetés kialakulhat hatalmas mennyiségű szimulált tapasztalatból anélkül, hogy emberi vezetési adatokra lenne szükség. ---