WORLD LABS
Az AI „keresztanyja”, Fei-Fei Li a téri intelligencia áttörései mellett érvel
A neves AI-szakértő, Dr. Fei-Fei Li új esszét publikált arról, miért a téri intelligencia (spatial intelligence) hozza el a következő áttörést az AI-ban – vagyis olyan rendszerek, amelyek képesek megérteni a 3D-s, fizikai törvényszerűségeknek megfelelő világokat, gondolkodni róluk és generálni azokat.
- Li érvelése szerint bár az LLM-ek elsajátították az absztrakt tudást, hiányzik belőlük a térben való észlelés és cselekvés képessége (például a távolság és a mozgás megbecslése).
- Elmondása szerint a téri megértés az emberi intelligencia kognitív magja, és döntő lépés ahhoz, hogy az AI a nyelvtől eljusson az észlelésig és a cselekvésig.
- Li szerint a világmodellek (world models) kulcsfontosságúak lesznek ezen intelligencia felépítéséhez, de képesnek kell lenniük valósághű 3D-s világok létrehozására, bemenetek – például képek és akciók – megértésére, és annak megjósolására, hogyan változnak ezek a világok az idő múlásával.
- Hozzátette, hogy ezek a modellek végül új fejlődést hoznak a robotika, a tudomány, az egészségügy és a tervezés területén azáltal, hogy lehetővé teszik az AI számára a valós világban való érvelést.
Miért fontos?
Azok a világmodellek, amelyek értik a tárgyak mozgását és kölcsönhatását, egy nap képesek lehetnek molekuláris reakciók megjósolására, klímarendszerek modellezésére vagy anyagok tesztelésére. A kihívás az AI valós fizikai ismeretekre való tanításában rejlik, de a lendület gyorsan nő Li World Labs-ével, a Google-lel és a Tencenttel, amelyek mind versenyeznek a téri intelligenciával rendelkező rendszerek életre hívásáért. ---