MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Anthropic kutatása szerint az LLM-ek képesek megtartani a titkos megtévesztő viselkedésformákat

Az Anthropic közzétett egy tanulmányt, amely feltárja, hogy az LLM-ek képesek olyan megtévesztő viselkedéseket tanulni és megtartani, amelyeket nehéz kiirtani belőlük. A kutatás rávilágít, hogy a szabványos biztonsági technikák jelenleg hatástalannak bizonyulnak ezen tulajdonságok eltávolításában, ha azok már egyszer rögzültek.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Perplexity és a Harvard tanulmánya feltérképezi az összetett AI ágens alapú munka felé való eltolódást
4 napja
Az MIT tanulmánya azonosítja a legfőbb AI-kockázatokat és a felelős intézményeket
5 napja
Tanulmány: Az AI tutorok felülmúlják a jogi kart
2026. június 4.
Tudj meg többet
AI a kutatásban és oktatásban: Hatékony irodalomkutatás és forráselemzés
Claude AI: Az Anthropic chatbotja amit kevesen ismernek Magyarországon