A Haize Labs a korábbi technológiánál 38-szor gyorsabb ACG Red Teaming módszert fejlesztett ki
A Haize Labs kutatói egy Greedy Coordinate Gradient (GCG) nevű AI red teaming megközelítésre építve jelentősen felgyorsították a folyamatot. Az általuk kifejlesztett Accelerated Coordinate Gradient (ACG) 38-szor gyorsabb, és 4-szer kevesebb GPU-memóriát igényel. Bár a GCG hatékony, nagyon költséges volt – egyetlen A100-as kártyán „akár 153 percig is eltarthatott egyetlen ellenséges támadás kidolgozása egy kifejezetten nehéz modell, például a Llama 2 ellen”.
- Az ACG 38-szor gyorsabb a standard GCG módszereknél.
- 4-szeresére csökkenti a GPU-memóriaigényt.
- Egyetlen támadás generálása az átlagos 71 percről 1,86 percre csökkent.
- Az iterációk csökkentésével és a legjobb támadások korábbi adatait tartalmazó puffer (historical buffer) használatával érték el.
- Alacsony költségű leállási feltételt alkalmaz, amely garantálja a támadás sikerét.
Miért fontos?
Az automatizált red teamingnek olcsónak kell lennie a hatékonysághoz: A red teaming értékes, de időben és pénzben meglehetősen költséges folyamat. Azonban figyelemre méltó úton halad afelé, hogy a nagyszabású stressztesztelés jelentősen elérhetőbbé váljon. ---