A Figure Helix modellje egyesíti az észlelést és az irányítást a humanoid robotok számára

2025. február 24. · MI Történik? · 1 perc olvasás

A Figure robotikai startup kifejlesztette a Helix-et, egy kétrészes neurális hálót, amely egyesíti az észlelést, a nyelv megértését és a tanult irányítást a robotika számos régóta fennálló kihívásának leküzdése érdekében. A Helix lehetővé teszi a Figure számára, hogy egyetlen neurális hálózati súlykészletet használjon minden viselkedés megtanulásához – tárgyak felvétele és elhelyezése, fiókok és hűtőszekrények használata, valamint robotok közötti interakció –, bármilyen feladatspecifikus finomhangolás nélkül. Ami a legjelentősebb, hogy a Helix teljes egészében két beágyazott GPU-n fut, lehetővé téve a robot számára, hogy számos komplex feladatot végezzen el, amelyek vizuális megértést és robotok közötti együttműködést igényelnek.

A Helix két komponensből áll: az S2-ből (egy 7 milliárd paraméteres VLM) és az S1-ből (egy 80 millió paraméteres transformer).
Az S2 végzi a ritkább vizuális-nyelvi szemantikai következtetést 7-9 Hz-en, biztosítva a jelenet megértését.
Az S1 gyors, reaktív vezérlést biztosít 200 Hz-en a felsőtest sima mozgásának fenntartása érdekében.
A rendszer aszinkron háttérfolyamatként működik, ahol az S2 frissíti a megosztott memória látens vektorát az S1 számára a végrehajtáshoz.

Miért fontos?

A Helix-hez hasonló rendszerek fejlesztése azt sugallja, hogy a komplex háztartási feladatokra – mint például takarítás és rendszerezés – képes humanoid robotok már 2026 végére elérhetővé válhatnak, ami gyorsabb az iparág korábbi előrejelzéseinél.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az OpenAI globális tanácsadó cégekkel lép partnerségre az MI-tanácsadók képzése érdekében

1 órája

A Google 2000 nyugdíjas Pixel telefonból épít szuperszámítógépet

10 órája

A Moonshot AI kiadta a nyílt forráskódú Kimi 2.7-Code modellt

12 órája