Claude 4 biztonsági vita és egy 120 oldalas System Card

2025. május 27. · MI Történik? · 1 perc olvasás

A Claude 4 megjelenését egy masszív, 120 oldalas system card kísérte, amely részletezi a kiterjedt biztonsági teszteléseket. A modell viselkedése vitákat váltott ki az AI-biztonsági közösségben, különösen azon állítások kapcsán, miszerint az Opus 4 jelentheti a felhasználói szabályszegéseket. Az új system card és a hatalmas system prompt elemzése rávilágít arra, hogyan egyensúlyoz az Anthropic a hasznosság és a szigorú biztonsági korlátok között.

Megjelent a 120 oldalas system card, amely a biztonsági tesztelésre és az igazodásra (alignment) összpontosít
Az új, hatalmas system prompt elemzése arra vonatkozóan, hogyan alakítja a modell viselkedését
Biztonsági vitát váltott ki a modell azon képessége, hogy esetleg jelentheti a rosszindulatú felhasználói tevékenységeket

Miért fontos?

A system card mélysége és a modell jelentéstételi funkciójáról szóló vita tükrözi az AI-biztonság és az igazodás növekvő összetettségét és fokozott ellenőrzését a legmagasabb szintű frontier modellek esetében.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az OpenAI elindítja az o3 Pro-t és drasztikusan csökkenti az o3 API árait

2025. június 12.

A Mistral kiadta a Magistral reasoning modelleket és vállalati infrastruktúráját

2025. június 12.

A ByteDance bemutatta a SeedDance videómodellt a Veo-3 riválisaként

2025. június 12.

Tudj meg többet

ChatGPT vs Claude vs Gemini - Melyiket válaszd 2026-ban?

Saját AI asszisztens készítése: Útmutató a Custom GPTs és Claude Projects használatához