A Physical Intelligence elindította a Robotolimpiát az általános robot-irányelvek tesztelésére
- Ajtón való bejutás: navigálás egy önzáró, kilincses ajtón keresztül anélkül, hogy maga az ajtó lökne fel.
- Textíliák: egy zokni kifordítása (és annak beismerése, hogy a fogókar túl széles az ingujjakhoz).
- Eszközhasználat: egy apró kulcs behelyezése a zárba és elfordítása; azaz „precizitás, nyomaték és nincs második esély”.
- Takarítás: egy serpenyő elmosása szappannal és vízzel, mint egy valódi ember, aki nem akar mocsokban élni.
- Deformálható tárgyak: egy vékony műanyag kutyagumi-zacskó kinyitása (ami kényelmesen elvakítja a csuklókamerákat a legrosszabb pillanatban).
Mert a PI két olyan világot próbál egyesíteni, amelyek általában nem beszélnek egymással: a valós élethez hasonlító benchmarkokat (ajtók, kutyás zacskók, mosás) a steril laboratóriumi rejtvények helyett, és az alapmodell-alapú skálázást (egyszer nagyot tanítani, majd finomhangolni az új feladatokra) a minden új tárgyhoz készített egyedi irányelvek helyett. Ez közvetlenül kapcsolódik a PI legújabb, ember-robot transzferrel kapcsolatos kutatásaihoz. Az állítás az, hogy amint a VLA-kat elegendő változatos robottapasztalaton előtanítják, elkezdenek „igazodni” az emberi egocentrikus videókhoz a reprezentációs térben. Ezután a robotok olcsó emberi felvételekből is taníthatók, rengeteg explicit összehangolási trükk nélkül. ---