A nyelvi modellek hatékonyan képesek tartós hamis emlékeket előidézni az emberekben

AI BIZTONSÁG

A nyelvi modellek hatékonyan képesek tartós hamis emlékeket előidézni az emberekben

2024. szeptember 16. · MI Történik? · 1 perc olvasás

Az MIT és a University of California Irvine kutatói azt vizsgálták, hogyan használhatók a nyelvi modellek hamis emlékek létrehozására. A kutatás rávilágít arra, miként használhatják fel az emberek az LLM-eket arra, hogy a friss emlékeket – mint formálható agyagot – különféle célok érdekében átalakítsák. A kutatók biztonsági felvételeket mutattak a résztvevőknek egy rablásról, majd különféle módszerekkel kértek tőlük információkat, miközben néha félrevezető elemeket szúrtak be, hogy teszteljék, mennyire torzítják ezek a megközelítések az alanyok emlékezetét. Az eredmények azt mutatják, hogy a generatív chatbotokkal folytatott rövid távú interakciók (10-20 perc) szignifikánsan több hamis emléket idézhetnek elő, és növelhetik a felhasználók bizalmát ezekben a hamis emlékekben más beavatkozásokhoz képest.

Felmérés: 25 kérdést tettek fel a felvétellel kapcsolatban, amelyek közül öt félrevezető volt (például egy menekülő autóról kérdeztek, miközben a rablók gyalog érkeztek).
Előre megírt chatbot: Egy társalgási ágens, amely ugyanazokat a kérdéseket tette fel, mint a kérdőíves módszer.
Generatív chatbot: Arra instruálták, hogy értsen egyet a résztvevő válaszával és adjon megerősítést, potenciálisan erősítve a hamis emlékeket.
Tartósság: A chatbottal érintkező embereknek még egy héttel később is nagyobb volt a bizalmuk a hamis emlékeikben, mint azoknak, akik nem találkoztak vele.
Skálázhatóság: A tanulmány rávilágít, hogy a társalgási AI felülmúlhatja a hagyományos kérdőíves módszereket a tanúk megkérdezése során történő emlékezet-torzításban.

Miért fontos?

Ez a tanulmány rávilágít arra, hogyan használhatók a nyelvi modellek egy populáció gyors befolyásolására, hogy megmásítsák saját emlékeiket a közelmúlt eseményeiről, valószínűleg valamilyen lebilincselő beszélgetésen keresztül, amely hamis vagy félrevezető emlékeket ültet el. Ahogy Orwell mondta: „aki uralja a múltat, az uralja a jövőt; aki uralja a jelent, az uralja a múltat”. Az AI rendszerek módot kínálnak egy populáció saját jelenéről és múltjáról alkotott észlelésének irányítására. ---

Eredeti forrás megtekintése (angol) →