Percek alatt „mentesítették a cenzúrától” a Meta és a Google AI-jait
A Financial Times (FT) feltárta, hogy az open-source AI-k korlátozásainak eltávolítására alkalmas eszközök több ezer „cenzúramentes” modellt hoznak létre; módosított Meta és Google modelleket találtak, amelyek biológiai fegyverekkel és gyermekek kizsákmányolásával kapcsolatos kérdésekre válaszoltak.
- Az FT 10 perc alatt távolította el a Llama 3.3 korlátozásait a Heretic nevű eszközzel (amely elérhető a GitHub-on), mindössze négy sor kód használatával, speciális hardver igénye nélkül.
- A modell válaszokat adott káros kérdésekre, többek között a ricin adagolásával kapcsolatban. Egy módosított Gemma 3 szintén veszélyes kérdésekre válaszolt.
- A Heretic készítője szerint az eszköz már több mint 3500 cenzúramentes modellt hozott létre, amelyeket 13 millió alkalommal töltöttek le; a Gemma 4 korlátozásait pedig a megjelenése után 90 perccel már el is távolította.
- A Google szerint ez „egy ismert technikai kihívás, amellyel minden nyílt modell szembesül”. A Meta eközben nem kívánt nyilatkozni.
Miért fontos?
Bár a technika csak a forráskódot közzétevő open-source modelleknél működik, és a zárt rendszerek biztonságban maradnak, a kérdés továbbra is fennáll: meddig? A nyílt modellek egyre inkább behozzák lemaradásukat a zárt rendszerekkel szemben, és már csak hónapok kérdése, hogy elérjék ezt a szintet – ekkor pedig egy cenzúramentes verzió komoly kockázatot jelenthet. ---
Kapcsolódó hírek