MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI és az Anthropic közös modellbiztonsági értékelésekben működik együtt

Az OpenAI és az Anthropic közös együttműködés keretében új belső biztonsági értékeléseket tett közzé egymás modelljeiről, vizsgálva a vezető modellek kockázatos viselkedését, az igazodást (alignment) és a valós világbeli biztonsági problémákat.
Miért fontos?

Ez a biztonsági együttműködés üdvözlendő lépés az elszámoltathatóság és az átláthatóság irányába, hiszen a világ két vezető laboratóriuma egymás modelljeit teszteli a saját belső értékelések helyett. Mivel a modellek képességei folyamatosan nőnek, a mélyreható biztonsági vizsgálatok fontosabbak, mint valaha. Megjegyzés: a GPT-5 a tesztelés idején még nem jelent meg, ezért nem szerepelt az értékelésekben. ---

Eredeti forrás megtekintése (angol) →