A Figure Helix modellje egyesíti az észlelést és az irányítást a humanoid robotok számára
A Figure robotikai startup kifejlesztette a Helix-et, egy kétrészes neurális hálót, amely egyesíti az észlelést, a nyelv megértését és a tanult irányítást a robotika számos régóta fennálló kihívásának leküzdése érdekében. A Helix lehetővé teszi a Figure számára, hogy egyetlen neurális hálózati súlykészletet használjon minden viselkedés megtanulásához – tárgyak felvétele és elhelyezése, fiókok és hűtőszekrények használata, valamint robotok közötti interakció –, bármilyen feladatspecifikus finomhangolás nélkül. Ami a legjelentősebb, hogy a Helix teljes egészében két beágyazott GPU-n fut, lehetővé téve a robot számára, hogy számos komplex feladatot végezzen el, amelyek vizuális megértést és robotok közötti együttműködést igényelnek.
- A Helix két komponensből áll: az S2-ből (egy 7 milliárd paraméteres VLM) és az S1-ből (egy 80 millió paraméteres transformer).
- Az S2 végzi a ritkább vizuális-nyelvi szemantikai következtetést 7-9 Hz-en, biztosítva a jelenet megértését.
- Az S1 gyors, reaktív vezérlést biztosít 200 Hz-en a felsőtest sima mozgásának fenntartása érdekében.
- A rendszer aszinkron háttérfolyamatként működik, ahol az S2 frissíti a megosztott memória látens vektorát az S1 számára a végrehajtáshoz.
Miért fontos?
A Helix-hez hasonló rendszerek fejlesztése azt sugallja, hogy a komplex háztartási feladatokra – mint például takarítás és rendszerezés – képes humanoid robotok már 2026 végére elérhetővé válhatnak, ami gyorsabb az iparág korábbi előrejelzéseinél.