Képezze az AI-t a SimWorld-ben, egy nagy hűségű, programozható videojáték szimulátorban

2025. december 8. · MI Történik? · 3 perc olvasás

Különböző országok számos egyetemének kutatói megépítették és kiadták a SimWorld-öt, egy Unreal Engine 5 szimulátort, amelyet az ügynökök (agents) betanítására lehet használni. A SimWorld célja, hogy egy grafikusan gazdag, procedurális és szkriptelhető világot biztosítson, amelyben AI-alapú ügynököket lehet futtatni. Ez egyaránt szolgál környezetként a meglévő ügynökök számára kihívást jelentő tesztek létrehozására, valamint tesztpadként új ügynökök reinforcement learning általi betanítására. A szimulátor ötvözi a „realisztikus fizikai és társadalmi dinamikát” a „nyitott, nyelvi alapon irányítható világgenerálással”. A SimWorld-öt az UCSD, UVA, UIUC, JHU, Purdue, PolyU, USC és UMich kutatói fejlesztették ki. Gondoljon a SimWorld-re úgy, mint egy eszközre, amelyet a kutatók az ügynökök tesztelésére és fejlesztésére használhatnak, hasonlóan ahhoz, ahogyan a meglévő tudományos és építészeti szoftvereket használták a mai AI rendszerek képességeinek tesztelésére és bővítésére. A SimWorld-ben „az ügynökök gazdag multimodális megfigyeléseket (pl. vizuális jeleneteket, absztrakt elrendezéseket és akció visszajelzéseket) észlelhetnek, és magas szintű nyelvi parancsokkal válaszolhatnak. Például egy ügynök képes érvelni és absztrakt akciót generálni, mint például „ülj le a legközelebbi székre”, amit a SimWorld automatikusan alacsony szintű akciók sorozatára bont (pl. útpontokon navigálás, leülés). Az akciók végrehajtása után a szimulátor frissített megfigyeléseket és visszajelzéseket biztosít, lehetővé téve az ügynök számára, hogy finomítsa stratégiáját és folytassa az érvelést” – írják a szerzők. „A rövid, feladatközpontú viselkedések mellett az ügynökök kiterjesztett célokat is követhetnek, mint például pénzkeresés, karrierút fejlesztése vagy multi-agent üzlet irányítása, ahol a stratégiai döntések idővel összeadódnak, és a társadalmi dinamika befolyásolja az eredményeket.” A SimWorld integrálja a text-to-3D modelleket is, mint például a Tencent [Hunyuan3D-jét](https://github.com/Tencent-Hunyuan/Hunyuan3D-2), így az emberek természetes nyelven leírhatják az eszközöket, amelyek aztán menet közben generálódnak és integrálódnak a szimulátorba, így triviálissá téve a bővíthetőséget.

Unreal Engine backend: Az alap az Unreal Engine, egy renderelő és fizikai szimulátor, amelyet széles körben használnak a játékiparban. Ez hozzáférést biztosít számos környezethez, valamint egy eszköz könyvtárhoz a környezetek betöltéséhez, és fizikai szimulációhoz.
Környezetek: Egy Python-alapú közvetítő réteg, amely segít a fejlesztőknek programozni az alapul szolgáló backend-et, eszközöket biztosítva olyan feladatokhoz, mint a környezetek generálása, szerkesztése (pl. „helyezz ide egy fát”), forgalmi rendszerek implementálása, és egy Python interfész biztosítása maguknak az ügynököknek a kölcsönhatáshoz.
Agent: Egy Python-alapú réteg az AI ügynökök számára, amely programozott hozzáférést biztosít számukra a Környezet réteghez, lehetővé téve számukra a világ megfigyelését és akciók végrehajtását is benne.

Miért fontos?

Mielőtt a nyelvi modellek lettek volna az AI fejlesztés domináns technikai paradigmája, sokan, akik intelligens gépeket próbáltak építeni, a reinforcement learning ügynökökre fogadtak. Konkrétan arra, hogy az AI ügynökök egyre gazdagabb, játékszerű környezetben való képzésével képesek lesznek intelligens, képzett ügynökök fejlesztésére. De visszatekintve, ennek a megközelítésnek volt egy kritikus hibája – az ügynököket üres lapról indították, így a végeredmény rendkívül költséges módja volt a rendkívül tehetséges játékosok (pl. először Atari, majd Go) és néha többféle játék (pl. AlphaGo Zero és Go, sakk és shogi szakértelme) előállításának. De nem jött létre igazi általános intelligencia. Mostanra bezárult a kör – mert most a SimWorld-höz hasonló környezetekben fejlesztett ügynökök jellemzően egy frontier AI rendszer, mint például a Claude, Gemini vagy ChatGPT alapuló világmodellre épülnek, és a SimWorld-öt arra használják majd, hogy több adatot generáljanak ezen rendszerek finetune-olására, hogy még képzettebbek legyenek. „Azáltal, hogy támogatja a fejlett LLM/VLM-alapú ügynököket, és lehetővé teszi a nagyszabású, realisztikus agent–environment és agent–agent interakciókat, a SimWorld bővíti a modern agent-based simulation (ABS) képességeit” – írják a kutatók. „Ez lehetővé teszi a robotika, üzlet, közegészségügy, társadalomtudomány, oktatás és más területek kutatói számára, hogy komplex rendszereket és emergent viselkedéseket tanulmányozzanak gazdag, dinamikus és kontrollálható környezetekben.”

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Cursor lokális, 7 dolláros „Start” csomagot indít Indiában

1 órája

Ultra-realisztikus luxustermék-reklámképek generálása

10 órája

A Notion bevezette a „Notion as code” koncepciót a munkaterületek üzembe helyezéséhez

12 órája

Tudj meg többet

Vektor Adatbázisok és RAG (Retrieval-Augmented Generation): Így teheted okosabbá és naprakészebbé az AI-t

AI adatbiztonság és adatvédelem: Hogyan használd az AI-t biztonságosan?