AI BIZTONSÁG
Az MIT tanulmánya a beágyazott AI-felügyeleti rendszerek skálázási törvényeit vizsgálja
Az MIT kutatói elméleti elemzést végeztek arról, hogyan működhet a skálázható felügyelet a kevésbé okos AI-któl az okosabb AI-k felé – és a jó hír az, hogy esélyt látnak a működőképességére. Ez megnyugtató, mivel a skálázható felügyelet az egyik olyan elképzelés, amelyben az AI közösség bízik: az emberek ezt fogják használni az embernél intelligensebb AI rendszerek felügyeletére. „A kulcsgondolat az, hogy a skálázható felügyelet öngerjesztő (bootstrapped) lehet: a gyengébb rendszerek felügyelik az erősebbeket, amelyek aztán a következő szakaszban még nagyobb képességű modelleket felügyelnek – lehetővé téve a felügyelet rekurzív skálázódását a képességekkel együtt. Ezt az iteratív folyamatot Nested Scalable Oversight-nak (Beágyazott Skálázható Felügyelet), vagy röviden NSO-nak nevezzük.”
- „Őröket” (felügyelőket) és „Houdiniket” (a felügyelet alól szabadulni próbáló modelleket) vizsgáltak
- Megállapították, hogy az őrök sokkal intelligensebb rendszereket is képesek felügyelni több felügyeleti lépés alkalmazásával
- A sikerességi arány 52% alá esik, ha a felügyelt rendszer több mint 400 Elo ponttal erősebb az alapvonalnál
- A felügyeleti feladatokat tervezésük révén a felügyelők javára kell torzítani
Miért fontos?
Minden a sebességen múlik: a kutatásból levont következtetésem az, hogy lehetséges lesz a felügyelőjüknél nagyobb képességű AI rendszerek felügyelete, amennyiben korlátozzuk az okosabb rendszerek műveleti sebességét, miközben biztosítjuk, hogy a felügyelőik ne maradjanak el túlságosan: a két kulcstényező itt az intelligencia és a felügyelet nélkül végrehajtható műveletek száma. ---