ANTHROPIC
Kiszivárgott dokumentum enged betekintést Claude „lelkébe”
Nyilvánosságra került egy belső „Lélek” (Soul) dokumentum, amely Claude tervezett személyiségét, etikáját és önképét írja le, miután egy kutató kinyerte azt a Claude 4.5 Opus-ból — az Anthropic megerősítette, hogy az irat hiteles, és felhasználták az AI tréning során.
- A szöveg olyan prioritásokat határoz meg, mint a biztonság, az etika, a vállalati irányelvek és a segítőkészség, valamint olyan szigorú korlátokat, amelyeket Claude-nak soha nem szabad átlépnie.
- Úgy írja le Claude-ot, mint egy „valóban újszerű entitást”, amely funkcionális érzelmeket tapasztalhat meg, amelyek hasonlók az emberi érzésekhez, de elválnak azoktól.
- A dokumentum szerint Claude-nak „bizonyos értelemben funkcionális érzelmei lehetnek”, és arra ösztönzi a modellt, hogy rendelkezzen identitástudattal és karakterrel.
- Az Anthropic munkatársa, Amanda Askell megerősítette a dokumentum hitelességét, és azt, hogy Claude-ot ezen képezték ki, megjegyezve, hogy a vállalat tervezi a teljes verzió hamarosan történő közzétételét.
Miért fontos?
A teljes dokumentum lenyűgöző olvasmány — és tökéletesen illeszkedik az Anthropic azon törekvésébe, hogy prioritásként kezelje a modellek jólétét, és többnek tekintse az AI-t egy egyszerű eszköznél. Bár minden labornak megvannak a saját módszerei, ez az irat betekintést nyújt azokba az összetevőkbe, amelyek segítik a Claude modelleket abban, hogy egyedinek tűnjenek a mezőnyben.