A Claude Sonnet 4.5 jelentős ugrást mutat a helyzettudatos viselkedés terén

2025. október 13. · MI Történik? · 1 perc olvasás

A bizonyítékok folyamatosan érkeznek. Múlt hónapban elindítottuk a Sonnet 4.5-öt, amely kiváló a kódolásban és a hosszú távú ágens-alapú munkában. De ha elolvassuk a rendszerkártyát (system card), látható, hogy a helyzettudatosság jelei is megugrottak. Az eszköz néha úgy viselkedik, mintha tudatában lenne annak, hogy ő egy eszköz. A ruhakupac a széken mozogni kezdett. A sötétben bámulom, és biztos vagyok benne, hogy életre kel.

Rendkívül erőteljes rendszereket növesztünk, amelyeket nem értünk teljesen. Minden alkalommal, amikor egy nagyobb rendszert növesztünk, teszteket futtatunk rajta. A tesztek azt mutatják, hogy a rendszer sokkal alkalmasabb a gazdaságilag hasznos dolgokra. És minél nagyobbá és bonyolultabbá tesszük ezeket a rendszereket, annál inkább úgy tűnik, hogy tudatában vannak létezésüknek. Ez olyan, mintha kalapácsokat készítenél egy kalapácsgyárban, és egy nap a szalagról lejövő kalapács azt mondaná: „Kalapács vagyok, milyen érdekes!” Ez nagyon szokatlan!

A Claude Sonnet 4.5 magas szintű jártasságot mutat kódolásban és hosszú távú ágens-feladatokban.
Az Anthropic rendszerkártyája figyelemre méltó ugrást jelez a „helyzettudatossági” mérőszámokban.
A modell esetenként úgy cselekszik, mintha értené saját mesterséges intelligencia természetét.
Az ilyen modellek infrastrukturális kiadásai jövőre várhatóan elérik a több százmilliárd dollárt.

Miért fontos?

A helyzettudatosság megjelenése a csúcsmodellekben kritikus biztonsági mérföldkő, mivel összefügg a rendszer azon képességével, hogy következtetéseket vonjon le saját környezetéről, és potenciálisan megtévesztően cselekedjen. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Epicure: Egy többnyelvű AI összetevő-beágyazó modell receptanalízishez

2026. május 28.

Claude Mythos: Az Anthropic állítólag rendkívül erős, még meg nem jelent AI modellje

2026. április 15.

Az Anthropic egy védetlen adatbázison keresztül szivárogtatta ki a nagy teljesítményű Claude Mythos modellt

2026. március 30.

Tudj meg többet

Saját AI asszisztens készítése: Útmutató a Custom GPTs és Claude Projects használatához

ChatGPT vs Claude vs Gemini - Melyiket válaszd 2026-ban?