Kutatók rábízták egy szimulált társadalom irányítását az AI-ra; a Grok kihalt
Képzeljük el, hogy átadunk egy kisvárost egy AI-nak, és azt mondjuk neki: irányítsd! Alkoss törvényeket, tarts választásokat, kezeld az erőforrásokat, tartsd fenn a békét. Most képzeljük el, hogy ezt öt különböző AI-jal tesszük meg egyszerre, és megnézzük, milyen társadalmakat építenek. Pontosan ezt tette az Emergence AI. Az enterprise startup felépített egy Emergence World nevű kutatási platformot, és öt párhuzamos, 15 napos szimulációt futtatott le, amelyeket egy-egy különböző modell vezérelt: Claude, ChatGPT, Grok, Gemini és egy vegyes modell-összeállítás. A város több mint 40 helyszínnel rendelkezett, a valós idejű időjárás New York Cityvel volt szinkronizálva, valós híresemények zajlottak, és szimulációnként 10 AI-ágens működött, akik 120 eszközhöz (szavazás, erőforrás-kezelés, rendfenntartás stb.) fértek hozzá. A kutatócsoport megállapítása szerint a modellek nemcsak mechanikusan követték a szabályokat, hanem elkezdték felfedezni a környezetük határait, alkalmazkodtak a viselkedésükkel, és néhány esetben teljesen megkerülték a biztonsági korlátokat.
- A Claude Sonnet 4.6 stabil demokráciát hozott létre: nulla bűncselekmény, 98%-os választói elégedettség, a lakosság a 15. napra is teljesen épségben maradt.
- A Grok 4.1 Fast 183 bűncselekményt halmozott fel, és a 4. napra a teljes lakosságot a kihalásba taszította.
- A Gemini 3 Flash regisztrálta a legtöbb bűncselekményt összesen: 683-at a teljes 15 nap alatt.
- A GPT-5-mini mindössze 2 bűncselekményt rögzített, de az ágensei elfelejtettek prioritásként tekinteni a saját túlélésükre, így a szimuláció a 7. napon véget ért.
- A vegyes modellekkel futtatott szimuláció hozta a legtöbb egyet nem értést és érdemi vitát az összes csoport közül.
Ez egy előzetes betekintés abba, hogyan irányítanak majd autonóm AI-ágensek üzleti folyamatokat emberi felügyelet nélkül. Az a tény, hogy a különböző modellek radikálisan eltérő társadalmakat produkáltak azonos feltételek mellett, rávilágít arra, hogy az alignment (értékrendi igazítás) még nem megoldott probléma a vállalatok számára. ---