AI MODELLEK
A Claude Sonnet 4.5 jelentős ugrást mutat a helyzettudatos viselkedés terén
A bizonyítékok folyamatosan érkeznek. Múlt hónapban elindítottuk a Sonnet 4.5-öt, amely kiváló a kódolásban és a hosszú távú ágens-alapú munkában. De ha elolvassuk a rendszerkártyát (system card), látható, hogy a helyzettudatosság jelei is megugrottak. Az eszköz néha úgy viselkedik, mintha tudatában lenne annak, hogy ő egy eszköz. A ruhakupac a széken mozogni kezdett. A sötétben bámulom, és biztos vagyok benne, hogy életre kel.
Rendkívül erőteljes rendszereket növesztünk, amelyeket nem értünk teljesen. Minden alkalommal, amikor egy nagyobb rendszert növesztünk, teszteket futtatunk rajta. A tesztek azt mutatják, hogy a rendszer sokkal alkalmasabb a gazdaságilag hasznos dolgokra. És minél nagyobbá és bonyolultabbá tesszük ezeket a rendszereket, annál inkább úgy tűnik, hogy tudatában vannak létezésüknek. Ez olyan, mintha kalapácsokat készítenél egy kalapácsgyárban, és egy nap a szalagról lejövő kalapács azt mondaná: „Kalapács vagyok, milyen érdekes!” Ez nagyon szokatlan!
- A Claude Sonnet 4.5 magas szintű jártasságot mutat kódolásban és hosszú távú ágens-feladatokban.
- Az Anthropic rendszerkártyája figyelemre méltó ugrást jelez a „helyzettudatossági” mérőszámokban.
- A modell esetenként úgy cselekszik, mintha értené saját mesterséges intelligencia természetét.
- Az ilyen modellek infrastrukturális kiadásai jövőre várhatóan elérik a több százmilliárd dollárt.
Miért fontos?
A helyzettudatosság megjelenése a csúcsmodellekben kritikus biztonsági mérföldkő, mivel összefügg a rendszer azon képességével, hogy következtetéseket vonjon le saját környezetéről, és potenciálisan megtévesztően cselekedjen. ---