A Microsoft Research skálázási törvényeket talált a világmodellezéshez és a viselkedésklónozáshoz

2024. november 18. · MI Történik? · 1 perc olvasás

A Microsoft kutatói úgynevezett „skálázási törvényeket” (scaling laws) fedeztek fel a világmodellezés és a viselkedésklónozás terén, amelyek hasonlóak az AI más területein, például az LLM-eknél tapasztaltakhoz. „Kimutatjuk, hogy a nyelvi modellezésben talált hatványtörvények (például a veszteség és az optimális modellméret között) a világmodellezésben és az utánzásos tanulásban (imitation learning) is megjelennek” – írják a kutatók.

A kutatók két különálló feladatot vizsgáltak a Bleeding Edge nevű videojátékban: a világmodellezést (ahol a modell megpróbálja megjósolni a jövőbeli megfigyeléseket a korábbiakból és a cselekvésekből), valamint a viselkedésklónozást (ahol a jövőbeli cselekvéseket jósolják meg a környezetben tevékenykedő emberek korábbi adatállományai alapján). A Bleeding Edge egy pörgős, 4 a 4 elleni többjátékos játék, összetett kooperatív és kompetitív dinamikával.

Bebizonyították, hogy a nyelvi modellezésben talált hatványtörvények alkalmazhatók a világmodellezésre és az utánzásos tanulásra is.
A Bleeding Edge videojáték adatait használták a skálázás tesztelésére összetett stratégiai és reaktív feladatokon keresztül.
Megállapították, hogy a WM-Token-256 architektúra skálázási együtthatói szorosan megegyeznek az LLM-ekéivel.
Arra utalnak, hogy a modell teljesítménye zökkenőmentesen skálázható az LLM szakirodalomból származó felismerések mentén.

Miért fontos?

Talán nincsenek is rejtélyek? Lehet, hogy az AI-ban minden egy skálázási törvényt követ. Ez komoly dolog – azt sugallja, hogy találtunk egy közös technológiát (itt a neurális hálókat), amely kiszámítható teljesítménynövekedést eredményez látszólag tetszőleges számú területen... csak megfelelően kell skálázni az adatokat és a számítási kapacitást (compute). ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Moonshot AI kiadta a nyílt forráskódú Kimi 2.7-Code modellt

1 órája

Az AARRI-Bench etikus és gondos kutatógyakornokként értékeli az AI-ágenseket

3 órája

A Xiaomi elképesztő, másodpercenkénti 1000 tokenes sebességet ért el a MiMo-V2.5-Pro-UltraSpeed modellel

3 órája

Tudj meg többet

Microsoft Copilot: Teljes útmutató magyarul (2026)