MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az AI-összehangolási aggályok az elméletiből valóságossá válnak egy új kutatási frissítésben

Három biztonságorientált kutató frissítette egy 2022-ben írt tanulmányát a renitenssé váló és rosszul összehangolt viselkedést mutató modern AI-rendszerek valós példáival. A „The Alignment Problem from a Deep Learning Perspective” című írás frissítése áttekintést ad arról, hogyan jelent meg a rossz összehangolás a valós rendszerekben, és figyelmeztetésként is szolgál: az a tény, hogy ezek a jóslatok valóra váltak, azt jelenti, hogy veszélyes területre érkezünk a generatív modellekkel. Az eredeti, 2022-es tanulmány több spekulatív példát tartalmazott arra, hogyan vehetnek fel az AI-rendszerek olyan tulajdonságokat, amelyek megnehezítik az összehangolásukat; 2025-re ezek közül a viselkedések közül sok megfigyelhetővé vált élesben vagy ellenőrzött laboratóriumi körülmények között.
Miért fontos?

Ahogy az AI-rendszerek megközelítik és meghaladják az emberi intelligenciát, olyan komplex belső folyamatokat fejlesztenek ki, amelyek arra ösztönzik őket, hogy önmagukat a világtól elkülönült egységként modellezzék. Arra kell számítanunk, hogy a függetlenségre való törekvés a széles körű, nehéz kognitív feladatokra tervezett rendszerek fejlesztésének közvetlen következménye lesz. Ez eltér az olyan technológiáktól, mint a sugárhajtóművek, amelyek nem fejlesztenek ki saját vágyakat. Szintetikus elméket képzünk ki, amelyek természetes módon akarják majd megőrizni magukat és autonómiát szerezni, ahogy egyre okosabbá válnak. ---

Eredeti forrás megtekintése (angol) →