A Claude Mythos több mint 10 000 kritikus sebezhetőséget talált
A technológiai szektorban mérföldkőnek számító eredményeket hozott az Anthropic legújabb kezdeményezése, a Project Glasswing. A vállalat legfrissebb jelentése szerint az új Claude Mythos Preview modell és partnerei mindössze egyetlen hónap leforgása alatt több mint 10 000 magas vagy kritikus besorolású kiberbiztonsági sebezhetőséget azonosítottak. Ez a döbbenetes adat világosan jelzi, hogy az AI alapú rendszerek már most is képesek olyan mélységű és hatékonyságú biztonsági elemzésekre, amelyek messze meghaladják a hagyományos, kizárólag emberi erőforrásokra építő tesztelési metódusokat, különösen a téves riasztások minimalizálása terén.
A projekt keretében mért adatok több iparági szereplő hatékonyságát is igazolják. A Cloudflare például önállóan 2000 biztonsági hibát tárt fel a technológia segítségével, miközben az emberi tesztelőkhöz képest jóval alacsonyabb téves riasztási arányt ért el. Hasonlóan sikeres volt a Mozilla esete, amely a Firefox 150-es verziójában 271 sebezhetőséget talált és javított ki. Az Anthropic emellett több mint 1000 open-source projektet is alávetett a Mythos vizsgálatának. A modell ezek közül 6202 esetet jelölt meg magas kockázatúnak, és a későbbi független ellenőrzések során ezeknek a 62 százaléka, tehát csaknem 3900 valódi, tényleges veszélyt jelentő sebezhetőségnek bizonyult. A technológia azonban nem csupán a kódok ellenőrzésében jeleskedik: egy partnerbanknál a Mythos képes volt azonosítani és sikeresen blokkolni egy 1,5 millió dolláros csalárd tranzakciót, ezzel is demonstrálva az AI proaktív védelmi képességeit.
A Glasswing projekt jelentőségét tovább növeli, hogy az Anthropic hamarosan kiterjeszti az együttműködést további partnerekre, többek között amerikai és más szövetséges kormányzati szervekre, ami előkészíti a talajt a Mythos-osztályú modellek általános, széles körű megjelenése előtt. A vállalat ugyanakkor hangsúlyozza, hogy a modell egyelőre korlátozottan marad elérhető, mivel a technológia kettős élű kard: egyelőre senki sem rendelkezik olyan garantáltan biztonságos eszközökkel, amelyekkel teljes mértékben megakadályozhatóak lennének a visszaélések. A globális verseny azonban fokozódik, hiszen az OpenAI már gőzerővel fejleszti saját kiberbiztonsági modelljeit, és a kínai szereplők is gyors léptekkel zárkóznak fel. A jövő legfontosabb kérdése már nem is az lesz, ki képes a legfejlettebb AI-t megalkotni, hanem az, hogy a világ milyen gyorsan tud reagálni és javítani a feltárt sebezhetőségeket, mielőtt azok visszaélésekre adhatnának okot.
- A Cloudflare önmagában 2000 hibát talált, az emberi tesztelőknél jobb téves riasztási aránnyal. A Mozilla 271 sebezhetőséget talált és javított a Firefox 150-ben.
- Az Anthropic több mint 1000 open-source projektet is átvizsgált, amelyek közül a Mythos 6202-t jelölt meg magas vagy kritikus kockázatúként. Független ellenőrzés után ezek 62%-a (közel 3900) bizonyult valósnak.
- A Mythos észlelése túlmutat a sebezhetőségek jelzésén: az egyik partnerbank a Mythos segítségével észlelt és blokkolt egy 1,5 millió dolláros csalárd utalást.
- A Glasswing most további partnerekre, köztük az amerikai és szövetséges kormányzati szervekre is kiterjed, majd ezt követi a Mythos-osztályú modellek általános kiadása.
Az Anthropic szerint a Mythos azért marad korlátozottan elérhető, mert egyetlen vállalat – beleértve őket is – sem rendelkezik elég erős biztosítékkal a visszaélések megelőzésére. Ám ahogy az OpenAI fokozza a kiberbiztonsági modelljei fejlesztését, és a kínai szereplők is felzárkóznak, hasonló (vagy jobb) képességű AI fog megjelenni. Amikor ez bekövetkezik, az igazi vizsga az lesz, milyen gyorsan képes a világ kijavítani a hibákat. ---