TENCENT
A Tencent kiadta a Voyagert a nyílt forráskódú 3D világépítéshez
A Tencent nemrég tette közzé a HunyuanWorld-Voyagert, egy nyílt forráskódú, „ultra-nagy hatótávolságú” AI világmodellt, amely egyetlen fotót alakít át bejárható és exportálható 3D környezetté.
- A Voyager egy „világ-gyorsítótárat” (world cache) használ, amely tárolja a korábban generált jelenetrészleteket, így fenntartja a konzisztenciát, ahogy a kamerák hosszabb virtuális környezetekben mozognak.
- A Stanford WorldScore benchmarkján több mérőszámban is az élre került, legyőzve más nyílt forráskódú riválisokat a térbeli koherencia teszteken.
- A felhasználók billentyűzet vagy joystick segítségével irányíthatják a kamera mozgását, az exportálható 3D környezetek létrehozásához pedig mindössze egyetlen referenciakép szükséges.
- A rendszer arra is emlékszik, amit felfedezés közben hoz létre, így a korábbi területekre való visszatéréskor ugyanazt a látványt mutatja.
Miért fontos?
A világmodellek az AI egyik legfontosabb új területévé váltak; a laborok versenyeznek olyan rendszerek építéséért, amelyek értik a fizikai tereket ahelyett, hogy csak sík képeket generálnának. A Genie 3, a Mirage, a World-Voyager és más modellek között a lehetőségek tára (és az interaktív 3D környezetek felhasználási módjai) gyorsan bővül. ---