ROBOTICS
A Covariant bemutatta az RFM-1 robotikai alapmodellt az ipari automatizáláshoz
A Covariant, egy ipari robotok tárgyfelvételi és -elhelyezési rendszereit fejlesztő AI vállalat, közzétette az RFM-1 robotikai alapmodell (foundation model) részleteit. Az RFM-1 egy „8 milliárd paraméteres transformer modell, amelyet szövegen, képeken, videókon, robotműveleteken és különféle numerikus szenzoradatokon tanítottak”, célja pedig az, hogy az ipari robotok kezelését olyan egyszerűvé tegye, mint a nyelvi modellek szöveggenerálásra való utasítását.
A Covariant robotjai már számos raktárban működnek világszerte, így az RFM titka részben egy saját tulajdonú adatkészletben rejlik. „Rendszereink deformálható tárgyakat mozgatnak, kezelik az erős kitakarást, következtetéseket vonnak le az anyagok eltérő szívási dinamikájáról, megbirkóznak a mozgásban lévő, szabálytalan alakú tárgyak okozta káosszal, és az áruk széles skáláját kezelik a sminkektől és ruháktól kezdve az élelmiszereken át a gépalkatrészekig” – írja a Covariant. Ez magában foglalja az olyan „ritka események” észlelését is, mint a szállítószalagon végtelenül gördülő vagy váratlanul széteső tárgyak, ami segít az RFM-1-nek a fizikai világ mélyebb megértésében.
Az RFM végső soron azt jelenti, hogy az emberek másképp léphetnek interakcióba a robotokkal: egyszerű angol nyelven adhatnak utasításokat, a robotok pedig képesek elmagyarázni, ha problémába ütköznek, és mi okozza azt.
Az RFM-1 egyelőre prototípus, és még nem terjedt el széles körben. „A valós termelési adatokon végzett tesztelés ígéretes offline eredményei ellenére az RFM-1-et még nem telepítettük az ügyfelekhez” – írja a Covariant. „Az RFM-1 mint világmodell jelenleg viszonylag alacsony felbontáson (~512x512 pixel) és képkockasebességgel (~5 fps) működik. Bár a modell már képes érzékelni a nagyobb tárgydeformációkat, a kis tárgyakat és a gyors mozgásokat még nem tudja megfelelően modellezni.”
- 8 milliárd paraméteres transformer modell
- Szövegen, képeken, videón, robotműveleteken és szenzoradatokon tanítva
- Valódi raktári környezetből származó, saját ipari robotadatokat használ
- Lehetővé teszi az emberek számára a robotok természetes nyelven történő irányítását
- Képessé teszi a robotokat a problémák egyszerű angol nyelvű kommunikálására az operátorok felé
- Jelenleg prototípus, 512x512-es felbontással és 5 fps sebességgel működik
Miért fontos?
A nagy változások lassan, majd hirtelen történnek: az RFM-1 annak a jele, hogy a robotika – amely eddig lassú fejlődéséről és rendkívüli költségeiről volt ismert – hamarosan a szoftverorientált AI sebességével kezd el mozogni. Az RFM-1-hez hasonló rendszerek azt jelentik, hogy a meglévő ipari robotokat adatgyűjtőkkel, kamerákkal és alapmodell-alapú vezérlőrendszerekkel szerelhetjük fel, majd gyorsan tapasztalatot gyűjthetünk és új képességeket szabadíthatunk fel. ---