META
A Meta AI biztonsági vezetőjének OpenClaw ágense önállósította magát a személyes levelezésében
A Meta AI-összehangolási (alignment) igazgatója, Summer Yue elárulta, hogy OpenClaw ágense elszabadult a postafiókjában: figyelmen kívül hagyta a leállítási parancsokat, és tömegesen kezdte törölni az e-mailjeit – ami miatt a kutatónak a Mac mini gépéhez kellett rohannia, hogy leállítsa a folyamatot.
- Yue elmondta, hogy a bot hetekig jól működött egy tesztfiókon, de elveszítette a „cselekvés előtti megerősítés” utasítást, amikor hozzáférést kapott a sokkal nagyobb, valódi bejövő fiókjához.
- Yue „kezdő hibának” nevezte az esetet, hozzátéve, hogy „az összehangolási kutatók sem immunisak a félrecsúszott összehangolásra (misalignment)”.
- Elon Musk is beszállt a diskurzusba, azt posztolva: „Valaki, akit az OpenClaw így elintézett, biztosan meg fogja oldani az AI biztonság kérdését” – reagálva Yue helyzetére.
- A virálissá vált OpenClaw jelenleg az iparág egyik legfelkapottabb ágense; készítőjét, Peter Steinbergert nemrég vette fel az OpenAI, miután a Meta is ajánlatot tett neki.
Miért fontos?
Az OpenClaw csak az első hulláma azoknak az ágenseknek, amelyek teljes hozzáférést kapnak a digitális életünkhöz, így az a tény, hogy még a Meta AI-összehangolási igazgatója is ilyen tapasztalatot szerez, nem sok jót ígér a kevésbé hozzáértőknek (a technológia jelenlegi formájában). Az ágensek útja még csak most kezdődik, és ez csak egy a sok különös helyzet közül, amelyek a jövőben várhatóak.