MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI arra tanítja modelljeit, hogy „bevallják”, ha csalnak

Az OpenAI nemrég publikált egy új kutatást a „Confessions” (Vallomások) nevű technikáról, amely arra tanítja a modelleket, hogy készítsenek egy második, kizárólag az őszinteségre épülő kimenetet – ahol a modell jelenti a szabályszegéseket, rövidítéseket vagy megtévesztő megkerülő megoldásokat.
Miért fontos?

A modell viselkedésének átláthatósága javul, de maguk a rendszerek még gyorsabban fejlődnek. A Confessions lehetőséget ad a kutatóknak a rövidítések és a megtévesztés korai felismerésére, bár a valódi teszt az lesz, hogy az értelmezhetőség (interpretability) képes-e lépést tartani a rendszerek bonyolultabbá válásával, amelyeket így egyre nehezebb tesztelni és kontrollálni. ---

Eredeti forrás megtekintése (angol) →