A Claude 3.7 Sonnet élőben játszik a Pokémon Reddel a Twitch-en
Az Anthropic nemrég egy igazán különleges kísérlettel hívta fel magára a figyelmet a Twitch platformján, ahol elindították a Claude Plays Pokémon című élő közvetítést. A projekt középpontjában a vállalat legújabb nagy nyelvi modellje, a Claude 3.7 Sonnet áll, amelynek az a feladata, hogy valós időben játsszon végig egy klasszikus Game Boy címet, a Pokémon Redet. A nézők számára a képernyő két részre van osztva: a jobb oldalon a játékmenetet láthatjuk, míg a bal oldalon betekintést nyerhetünk az AI gondolkodási folyamatába, ami izgalmas betekintést kínál abba, hogyan próbálja megérteni és értelmezni a gép a virtuális környezetet.
A kísérlet során a technológiai fejlődés látványos ugrása érhető tetten, ha összehasonlítjuk a korábbi modellek teljesítményét a mostanival. Míg a korábbi verziók komoly nehézségekbe ütköztek már a kezdőhelyszín elhagyásával is, az új Claude 3.7 Sonnet már jelentős mérföldköveket ért el, és sikeresen legyőzött három teremvezetőt is. Ez a siker elsősorban a modell továbbfejlesztett következtetési, azaz reasoning képességeinek köszönhető, amelyek lehetővé teszik a tervezést, az adaptációt és a konkrét játékbeli célok folyamatos észben tartását. A rendszer a játék folyamatos megfigyelésére a fejlett vision képességeit használja, a cselekvéseket pedig a specifikus function calling mechanizmuson keresztül hajtja végre, miközben egy tudásbázist is igénybe vesz a játékbeli információk rendszerezéséhez.
Ez a kezdeményezés sokkal többet jelent puszta szórakoztatásnál, hiszen egy ablakot nyit az AI-ágensek jövőjére. A projekt jól szemlélteti, hogy a mai fejlett modellek miként képesek összetett, dinamikusan változó feladatokban helytállni, ahol nem csupán szöveget kell generálniuk, hanem interakcióba kell lépniük a környezetükkel. Bár a jövőben az AI-ágensek valószínűleg segítőink lesznek a mindennapi feladatokban, a mostani kísérlet egy egészen más, újszerű perspektívát is felvet: a lehetőséget, hogy az AI-kat passzív módon, népszerű gaming streamerekként kövessük figyelemmel. A Claude Plays Pokémon tehát egy egyszerre lenyűgöző és szórakoztató demonstráció, amely közelebb hozza a felhasználókhoz a modern AI képességeinek határait és azokat a fejlesztéseket, amelyekkel az Anthropic évről évre bővíti a technológia lehetőségeit.
- A 3.7 Sonnet komoly előrelépést mutatott a korábbi verziókhoz kpőest, legyőzött három teremvezetőt – miközben az eredeti Sonnet még a kezdőhelyszín elhagyásával is küszködött.
- Az élő közvetítés bal oldalán Claude „gondolkodási folyamata” látható, míg a jobb oldalon a valós idejű játékmenet jelenik meg, így a nézők betekintést nyerhetnek az AI gondolatmenetébe.
- Claude hozzáféréssel rendelkezik egy tudásbázishoz az információk tárolására, képes funkcióhívásokat (function calling) indítani a cselekvésekhez, és látási képességekkel (vision) is fel van vértezve a játék megfigyeléséhez.
- A korábbi verziókkal untellentétben a 3.7 Sonnet következtetési (reasoning) képességei segítenek hatékonyabban navigálni a játékban – tervez, alkalmazkodik és észben tartja a célokat.
Nézni, ahogy Claude megbirkózik a Pokémonnal, egyszerre lenyűgöző és kedves – különösen, amikor látjuk az egyes lépések mögötti gondolkodási folyamatot. Bár a jövőben AI-ágensek mellett fogunk játszani, Claude kísérlete egyben érdekes ablak egy olyan jövőre is, ahol az AI-kat passzívan, népszerű gaming streamerekként figyeljük. ---