MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Képezze az AI-t a SimWorld-ben, egy nagy hűségű, programozható videojáték szimulátorban

Különböző országok számos egyetemének kutatói megépítették és kiadták a SimWorld-öt, egy Unreal Engine 5 szimulátort, amelyet az ügynökök (agents) betanítására lehet használni. A SimWorld célja, hogy egy grafikusan gazdag, procedurális és szkriptelhető világot biztosítson, amelyben AI-alapú ügynököket lehet futtatni. Ez egyaránt szolgál környezetként a meglévő ügynökök számára kihívást jelentő tesztek létrehozására, valamint tesztpadként új ügynökök reinforcement learning általi betanítására. A szimulátor ötvözi a „realisztikus fizikai és társadalmi dinamikát” a „nyitott, nyelvi alapon irányítható világgenerálással”. A SimWorld-öt az UCSD, UVA, UIUC, JHU, Purdue, PolyU, USC és UMich kutatói fejlesztették ki. Gondoljon a SimWorld-re úgy, mint egy eszközre, amelyet a kutatók az ügynökök tesztelésére és fejlesztésére használhatnak, hasonlóan ahhoz, ahogyan a meglévő tudományos és építészeti szoftvereket használták a mai AI rendszerek képességeinek tesztelésére és bővítésére. A SimWorld-ben „az ügynökök gazdag multimodális megfigyeléseket (pl. vizuális jeleneteket, absztrakt elrendezéseket és akció visszajelzéseket) észlelhetnek, és magas szintű nyelvi parancsokkal válaszolhatnak. Például egy ügynök képes érvelni és absztrakt akciót generálni, mint például „ülj le a legközelebbi székre”, amit a SimWorld automatikusan alacsony szintű akciók sorozatára bont (pl. útpontokon navigálás, leülés). Az akciók végrehajtása után a szimulátor frissített megfigyeléseket és visszajelzéseket biztosít, lehetővé téve az ügynök számára, hogy finomítsa stratégiáját és folytassa az érvelést” – írják a szerzők. „A rövid, feladatközpontú viselkedések mellett az ügynökök kiterjesztett célokat is követhetnek, mint például pénzkeresés, karrierút fejlesztése vagy multi-agent üzlet irányítása, ahol a stratégiai döntések idővel összeadódnak, és a társadalmi dinamika befolyásolja az eredményeket.” A SimWorld integrálja a text-to-3D modelleket is, mint például a Tencent [Hunyuan3D-jét](https://github.com/Tencent-Hunyuan/Hunyuan3D-2), így az emberek természetes nyelven leírhatják az eszközöket, amelyek aztán menet közben generálódnak és integrálódnak a szimulátorba, így triviálissá téve a bővíthetőséget.
Miért fontos?

Mielőtt a nyelvi modellek lettek volna az AI fejlesztés domináns technikai paradigmája, sokan, akik intelligens gépeket próbáltak építeni, a reinforcement learning ügynökökre fogadtak. Konkrétan arra, hogy az AI ügynökök egyre gazdagabb, játékszerű környezetben való képzésével képesek lesznek intelligens, képzett ügynökök fejlesztésére. De visszatekintve, ennek a megközelítésnek volt egy kritikus hibája – az ügynököket üres lapról indították, így a végeredmény rendkívül költséges módja volt a rendkívül tehetséges játékosok (pl. először Atari, majd Go) és néha többféle játék (pl. AlphaGo Zero és Go, sakk és shogi szakértelme) előállításának. De nem jött létre igazi általános intelligencia. Mostanra bezárult a kör – mert most a SimWorld-höz hasonló környezetekben fejlesztett ügynökök jellemzően egy frontier AI rendszer, mint például a Claude, Gemini vagy ChatGPT alapuló világmodellre épülnek, és a SimWorld-öt arra használják majd, hogy több adatot generáljanak ezen rendszerek finetune-olására, hogy még képzettebbek legyenek. „Azáltal, hogy támogatja a fejlett LLM/VLM-alapú ügynököket, és lehetővé teszi a nagyszabású, realisztikus agent–environment és agent–agent interakciókat, a SimWorld bővíti a modern agent-based simulation (ABS) képességeit” – írják a kutatók. „Ez lehetővé teszi a robotika, üzlet, közegészségügy, társadalomtudomány, oktatás és más területek kutatói számára, hogy komplex rendszereket és emergent viselkedéseket tanulmányozzanak gazdag, dinamikus és kontrollálható környezetekben.”

Eredeti forrás megtekintése (angol) →