MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI arra tanítja modelljeit, hogy „bevallják”, ha csalnak

Az OpenAI nemrég publikált egy új kutatást a „Confessions” (Vallomások) nevű technikáról, amely arra tanítja a modelleket, hogy készítsenek egy második, kizárólag az őszinteségre épülő kimenetet – ahol a modell jelenti a szabályszegéseket, rövidítéseket vagy megtévesztő megkerülő megoldásokat.

Miért fontos?

A modell viselkedésének átláthatósága javul, de maguk a rendszerek még gyorsabban fejlődnek. A Confessions lehetőséget ad a kutatóknak a rövidítések és a megtévesztés korai felismerésére, bár a valódi teszt az lesz, hogy az értelmezhetőség (interpretability) képes-e lépést tartani a rendszerek bonyolultabbá válásával, amelyeket így egyre nehezebb tesztelni és kontrollálni. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Sam Altman az OpenAI tőzsdei bevezetését az öntovábbfejlesztő AI fejlődésétől tenné függővé
2 napja
Az OpenAI a fejlesztés egy új, „harmadik szakaszába” lépett
4 napja
Hamarosan érkezik az OpenAI „szuperalkalmazása”
5 napja
Tudj meg többet
OpenAI Sora: AI videógenerálás – minden, amit tudni kell
OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép