ROBOTIKA
A Sony Ace robotja legyőzi az elit emberi pingpongjátékosokat
43 éve próbálnak a tudósok tökéletes pingpong robotot fejleszteni. De az összes korábbi publikáció tartalmazott "csillagozott megjegyzéseket": összezsugorított pályák, módosított ütők, vagy robotok szervával vagy pörgetéssel. Más néven: én játszom (szomorú). Nos, a Sony AI mai Nature címlapos cikke egyik fenti pontot sem tartalmazza. Ismerje meg Ace-t, a végső pingpong robotot. A barátja, akinek volt egy pince asztala, sírva menne haza. Nesze neked, Billy! Végre! A végső bosszúm!
- A mérkőzések. Teljes ITTF szabályok (a Nemzetközi Asztalitenisz Szövetség hivatalos szabálykönyve, amit a profik is használnak az olimpiákon) szerint, olimpiai méretű pályán (~14m × 7m, sokkal nagyobb, mint Billy pincéjének asztala) a Sony tokiói főhadiszállásán, Ace öt elit amatőrrel (10+ év edzés) és két japán profival játszott. 2025 április: 3-2 az elitek ellen, 0-2 a profik ellen.
- 2025 decemberi visszavágó: Ace legyőzte mindkét elit játékost ÉS egy profi játékost.
- 2026 március: Ace mindhárom új profi játékost legalább egyszer legyőzte. A visszavágó körút nem úgy alakult, ahogy a visszavágó körutaknak szokásuk. Az underdogok elbuktak.
- A technológia: Kilenc kamera triangulálja a labdát (több kameraállást kombinálva határozza meg annak pontos 3D pozícióját) 200 Hz-en (másodpercenként 200 pillanatkép).
- Három eseményalapú látáskamera (speciális Sony chipek, amelyek csak azokat a pixeleket jelölik meg, amelyek fényereje változik, ahelyett, hogy teljes képkockákat készítenének, mint a telefonja) figyeli a labdára nyomtatott logót, hogy leolvassák, milyen gyorsan pörög.
- Latencia: 10.2 milliszekundum (ms). Körülbelül 30-szor gyorsabb, mint egy emberi pislogás. Az emberek ~230 ms alatt reagálnak, ami azt jelenti, hogy Ace tízszer gyorsabban látja a labdát, mint te. Egy mély reinforcement learning (RL) policy (az AI képzési módszer, ahol a rendszer próbálgatással, milliók gyakorló játékon keresztül tanul; ugyanaz a technikai család, amely AlphaGo-t megtanította a Go világbajnok legyőzésére) teljes mértékben szimulációban (egy fizikailag pontos pingpong videojáték verzióban) képződött, és a valós pályán nulla finomhangolással (azaz: mindent a szimulátorból tanult meg, nem volt szükség gyakorló mérkőzésekre) irányítja a kart.
- Hogyan nyer: Nem erővel. Ace nyerő ütései statisztikailag megkülönböztethetetlenek a visszahúzott ütéseitől (p=0.88; a statisztikában a p-érték megmutatja, mennyire valószínű egy eredmény a véletlennek köszönhetően, így a p=0.88 alapvetően "azonosat" jelent).
- Az emberi nyerő ütéseket drámaian nehezebb kivitelezni, mint az átlagos ütéseiket (p<0.001, ami azt jelenti, hogy "alapvetően biztos, hogy valódi különbség van").
- Ace azért nyer, mert szinte sosem hibázik, a labdák 75%-át visszaüti, akár 450 rad/s pörgetésig (körülbelül 72 teljes fordulat másodpercenként, miközben a labda a levegőben van).
- Az embereknek vannak jellegzetes ütéseik. Ace-nek nincsenek.
Miért fontos?
Az AI 1997-es sakk óta törli el a "megoldhatatlan" benchmarkokat. Go, StarCraft, Gran Turismo (a PlayStation autóverseny szimulátor), drónverseny (ahol AI-pilóta drónok legyőzték az emberi bajnokokat első személyű nézetű akadálypályákon). De mind digitális vagy statikus volt. Ace az első fizikai, valós idejű, adversariális sport (adversariális azt jelenti, hogy egy ember aktívan próbálja legyőzni, nem pedig egy egyszer megoldandó rejtvény) valódi szabályok szerint. A Sony AI vezető tudósa, Peter Stone az Apollo programhoz hasonlította: "nem az azonnali kereskedelmi hasznosításról szól, hanem a belőle származó technológiákról." ---