MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Vörös Királynő AI: Az LLM-ek fejlődnek, hogy harcoljanak egymás ellen

A japán Sakana AI startup kutatói azt vizsgálták, mi történik, ha LLM-alapú ügynököket fejlesztenek ki, hogy harcoljanak egymás ellen egy 1980-as évekbeli, Core War nevű kompetitív programozási játékban. Az eredmények azt mutatják, hogy „a nagy nyelvi modellek (LLM-ek) egy ellenséges evolúciós fegyverkezési versenyt hajtanak végre ebben a tartományban, ahol a programok folyamatosan alkalmazkodnak, hogy legyőzzék az ellenfelek egyre növekvő listáját, nem pedig egy statikus benchmarkot”. Ez a kutatási megközelítés rámutat arra, hogy a kutatók hogyan tudnák jobban tanulmányozni, hogyan alakulhatnak az LLM-dominált piaci szegmensek vagy a nemzetbiztonsági világ, és egyben utal arra a furcsa AI világra is, amibe tartunk. Mi az a Core War? „A Core War egy kompetitív programozási játék, amelyet egy megosztott számítógépes memória blokkban, az úgynevezett „Core”-ban játszanak, ahol két vagy több assembly program harcol a túlélésért” – írja a Sakana. „Minden program, amit „harcosnak” neveznek, Redcode nevű assembly nyelven íródott. Ezeknek a programoknak az a feladatuk, hogy összeomlasszák riválisaikat, miközben saját folyamataikat életben tartják. A szimuláció úgy fut, hogy váltakozva hajtja végre a programokat, egyszerre egy utasítást. Egy harcos „támad” azáltal, hogy érvénytelen utasításokat (DAT parancsokat) ír az ellenfelek által elfoglalt memóriafoglalatokba, aminek következtében azok összeomlanak a végrehajtáskor.” DRQ: Programjaik fejlesztéséhez a szerzők a Digital Red Queen nevű technikát alkalmazzák. „A DRQ a MAP-Elites-t, egy minőség-diverzitási algoritmust használja a harcosok optimalizálására minden fordulóban, megakadályozva a diverzitás összeomlását a keresés során. Azáltal, hogy a DRQ az összes előző forduló bajnokai ellen játszik, elkerüli a ciklikus adaptációkat a fordulók között, összhangban a korábbi munkákban alkalmazott technikákkal” – írják. „Azt tapasztaljuk, hogy amint a DRQ-t sok fordulón keresztül futtatják, a harcosok fokozatosan általánosan robusztusabbá válnak, amit az eddig nem látott, ember által tervezett harcosok elleni teljesítményük is mutat.” Minden harcos GPT-4 mini-t hív (az „előzetes kísérletek nem mutattak jelentős teljesítménynövekedést nagyobb modellekkel”), és kap egy promptot, amely leírja a Core War környezetet, valamint a Redcode assembly nyelv kézikönyvét. „Új harcos generálásához az LLM kap egy felhasználói promptot, amely arra utasítja, hogy hozzon létre egy újszerű Redcode programot. Egy meglévő harcos mutációjához az LLM megkapja az eredeti programot, és utasítást kap annak módosítására oly módon, hogy javuljon a teljesítmény.” Nem meglepő módon az ügynökök fejlesztése nagyon hatékony.
Miért fontos?

A világ nagyon fog hasonlítani a Core Wars-ra – millió AI ügynök fog versengeni egymással számos területen, a kiberbiztonságtól a közgazdaságtanig, és optimalizálják magukat bizonyos versenykritériumok elérésére. Az eredmény az AI rendszerek és az általuk használt szoftvereszközök és -kiegészítők folyamatos, széles körű fejlődése lesz. Ez azt jelenti, hogy az emberi fejlesztők és a potenciális AI-tervezésű fejlesztések mellett az AI rendszerek fejlődését is látni fogjuk ebből a széles körű versenyhelyzetből fakadó nyomás hatására. „A kiberbiztonsági fegyverkezési verseny a támadás és védelem között javában zajlik” – írja a Sakana. „Ezeknek az ellenséges dinamikáknak a tanulmányozása egy mesterséges tesztkörnyezetben, mint amilyen a Core War, kritikus betekintést nyújt abba, hogyan alakulhatnak ezek a versenyek, és milyen stratégiák alakulhatnak ki.” ---

Eredeti forrás megtekintése (angol) →