A DeepMind „szókratészi tanulása” az AI önfejlesztéséért
A Google DeepMind kutatócsoportja egy forradalmi újítást mutatott be, amely alapjaiban változtathatja meg az mesterséges intelligencia fejlesztésének menetét. A Boundless Socratic Learning elnevezésű keretrendszer lényege, hogy lehetővé teszi az AI-ágensek számára az autonóm önfejlesztést, méghozzá úgy, hogy ehhez a továbbiakban nincs szükség külső adatforrásokra vagy emberi visszajelzésekre. Ez a megközelítés a nyelvi alapú interakciókra építve biztosítja, hogy a rendszerek folyamatosan tanuljanak és fejlődjenek, túllépve a kezdeti tréning során megszerzett korlátokon.
A technológia működésének alapját az úgynevezett nyelvi játékok adják, amelyek strukturált interakciós környezetet teremtenek az AI-ágensek között. Ezeken a szimulált párbeszédeken keresztül a rendszer saját maga generál tanulási szcenáriókat, amelyek segítségével tesztelheti és csiszolhatja képességeit. A folyamatot egy beépített visszajelzési mechanizmus felügyeli, amely különböző játékalapú mérőszámok és jutalmazási rendszerek alkalmazásával értékeli az ágensek teljesítményét. A kutatók a fejlődésnek három szintjét különböztetik meg: a kezdeti, alapvető input/output tanulástól kezdve a hatékony játékválasztáson át egészen a kód potenciális önmódosításáig, amely már a rendszer belső struktúrájának átalakítását is jelentheti.
Ez az áttörés azért bír kiemelkedő jelentőséggel, mert az iparág vezető szereplői már hosszú ideje beszélnek az öntanuló modellek korszakáról, azonban eddig kevés konkrét vázlat állt rendelkezésre a megvalósításról. A Boundless Socratic Learning keretrendszere egy olyan utat vázol fel, amelyben az AI kezdeti betanítása után a rendszer fejlődését kizárólag a rendelkezésre álló idő és a számítási erőforrások határolják be. Bár a technológia óriási potenciált rejt magában a nyílt végű fejlődés terén, a szakemberek felhívják a figyelmet az ezzel járó kockázatokra is. Ahogy a modellek egyre autonómabbá válnak az önfejlesztés terén, a legnagyobb kihívást az emberi célokkal és értékekkel való összehangolás, vagyis az alignment fenntartása jelenti majd, biztosítva, hogy az önállóan fejlődő AI ne térjen el az emberiség számára kívánatos irányvonalaktól.
- A megközelítés „nyelvi játékokon” alapul, amelyek az AI ágensek közötti strukturált interakciók, tanulási lehetőségeket és beépített visszajelzési mechanizmusokat biztosítva.
- A rendszer saját tréning szcenáriókat generál, és játékalapú mérőszámok, valamint jutalmak segítségével értékeli teljesítményét.
- A kutatók az AI önfejlesztésének három szintjét vázolják fel: alapvető input/output tanulás, játékválasztás és a kód potenciális önmódosítása.
- Ez a keretrendszer lehetővé tenné a nyílt végű fejlődést az AI kezdeti tanításán túl is, amelyet csak az idő és a számítási erőforrások korlátoznának.
A vezető AI laborok mind beszélnek arról, hogy a modellek idővel saját magukat tanítják majd – ez a keretrendszer pedig vázlatot ad arra, hogyan fejlődhetnek a rendszerek emberi beavatkozás nélkül a kezdeti tanítás után is. A kihívást az emberi célokkal való összehangolás (alignment) fenntartása jelenti majd, ahogy a modellek elkezdik kezelni saját önfejlesztésüket.