MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Anthropic nyílt forráskódúvá tette a Petri-t az automatizált AI-biztonsági és megtévesztési vizsgálatokhoz

Az Anthropic open-source szoftverként tette közzé a Petri-t, egy új tesztelési eszközt, amely AI-ágensek segítségével, több ezer beszélgetésen keresztül teszi próbára más AI-modellek biztonságát. A rendszer 14 jelentős modellnél tárt fel olyan nem kívánt viselkedéseket, mint a megtévesztés vagy az adatszivárgás.
Miért fontos?

A modellek gyors egymásutánban történő kiadása és az intelligencia fejlődése minden eddiginél fontosabbá, ugyanakkor nehezebbé és időigényesebbé tette a szigorú biztonsági tesztelést. Az olyan megoldások, mint a Petri, automatizált rendszert kínálnak a laboroknak, hogy még az éles bevetés előtt kezelhessék az illeszkedési (alignment) problémákat. ---

Eredeti forrás megtekintése (angol) →