MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Anthropic új teszteket mutatott be a potenciális AI-szabotázs kockázatainak észlelésére

Az Anthropic új értékelési módszereket tett közzé, amelyek célja a fejlett AI rendszerek potenciális szabotázsképességeinek észlelése, fókuszálva azokra a kockázatokra, amelyek akkor merülhetnek fel, ha a modellek megpróbálják kijátszani az emberi felügyeletet vagy döntéshozatalt.
Miért fontos?

Az Anthropic kutatása rávilágít, hogy az AI még nem túl jó az emberek szabotálásában... egyelőre. Azonban a képességek bizonyos mértékig már jelen vannak – és ha a modellek fejlődése a várakozásoknak megfelelően folytatódik, csak idő kérdése, hogy ezek a fenyegetések valóssá váljanak, így elengedhetetlen a mérséklésük. ---

Eredeti forrás megtekintése (angol) →