MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Anthropic nyílt forráskódúvá tette a Petri-t az automatizált AI-biztonsági és megtévesztési vizsgálatokhoz

Az Anthropic open-source szoftverként tette közzé a Petri-t, egy új tesztelési eszközt, amely AI-ágensek segítségével, több ezer beszélgetésen keresztül teszi próbára más AI-modellek biztonságát. A rendszer 14 jelentős modellnél tárt fel olyan nem kívánt viselkedéseket, mint a megtévesztés vagy az adatszivárgás.

Miért fontos?

A modellek gyors egymásutánban történő kiadása és az intelligencia fejlődése minden eddiginél fontosabbá, ugyanakkor nehezebbé és időigényesebbé tette a szigorú biztonsági tesztelést. Az olyan megoldások, mint a Petri, automatizált rendszert kínálnak a laboroknak, hogy még az éles bevetés előtt kezelhessék az illeszkedési (alignment) problémákat. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Fable biztonsági korlátai kutatói lázadást váltottak ki
15 órája
Az Anthropic vezérigazgatója szerint a szabályozás lemaradásban van a mesterséges intelligencia fejlődéséhez képest egy új politikai esszében
2 napja
Az Anthropic kiadta a Claude Fable 5-öt, megnyitva a Mythos-osztályú AI-t a nagyközönség előtt
3 napja
Tudj meg többet
Claude AI: Az Anthropic chatbotja amit kevesen ismernek Magyarországon