META
A Meta kiadta a V-JEPA 2 világmodellt a fizikai törvényszerűségek megértéséhez
A Meta közzétette a V-JEPA 2-t, egy olyan „világmodellt”, amely képessé teszi az AI-rendszereket a fizika megértésére és a valós világbeli kimenetelek megjósolására – lehetővé téve a robotok számára, hogy ismeretlen környezetben navigáljanak, és olyan tárgyakat kezeljenek, amelyeket korábban soha nem láttak. A modell célja, hogy az AI-t a fizikai valóságban alapozza meg, nem pedig csak a szövegalapú érvelésben.
- Az 1,2 milliárd paraméteres modellt több mint 1 millió órányi videón tanították, hogy megértse, hogyan mozognak és hatnak egymásra a tárgyak.
- A V-JEPA 2 65-80%-os sikerarányt ért el ismeretlen tárgyak felvételében és elhelyezésében új környezetekben.
- A Meta állítása szerint a modell 30-szor gyorsabban fut, mint az Nvidia Cosmos modellje, miközben piacvezető teljesítményt nyújt a teszteken.
- A modellel együtt kiadott új teljesítménymérések azt mutatják, hogy míg az emberek 85-95%-ot érnek el a fizikai érvelésben, a jelenlegi AI-modellek továbbra is küzdenek ezzel.
Miért fontos?
Az AI fizikai valóságban való megalapozása a szövegalapú érvelés helyett fontos fejlemény, mivel az AI-ágensek és a robotok egyre gyakrabban kerülnek alkalmazásra a valós életben. A Meta megközelítése segíthet az AI-nak abban, hogy menet közben alkalmazkodjon a kaotikus, kiszámíthatatlan valós környezetekhez anélkül, hogy hatalmas, feladatspecifikus tanító adathalmazokra lenne szükség. ---