Véletlenül kiszivárogtatta a ChatGPT Advanced Voice Mode a tanítóadatait?

2026. május 23. · MI Történik? · 2 perc olvasás

Véletlenül kiszivárogtatta a ChatGPT Advanced Voice Mode a tanítóadatait? Ez a kérdés tartja lázban jelenleg a technológiai világot, miután a felhasználók rendkívül furcsa és váratlan viselkedésről számoltak be az OpenAI legújabb fejlesztésével kapcsolatban. Az Advanced Voice Mode (AVM) használata során tapasztalt jelenségek ugyanis arra utalhatnak, hogy a modell akaratlanul is részleteket fed fel azokból a tanítóadatokból, amelyek alapján felkészítették a működésre. Az eset gyorsan elterjedt a tech közösségben, és komoly vitákat indított el az AI rendszerek mögött álló technológiákról.

A találgatások bázisát egy nemrégiben a Redditen megosztott konkrét példa adja, amelyben egy egészen megdöbbentő hangfelvétel hallható. Ezen a felvételen a ChatGPT Advanced Voice Mode funkciója úgy szólal meg, mintha egy valódi emberi szinkronszínész beszélne a színfalak mögött. A hallottak alapján a felhasználók úgy értékelték a helyzetet, mintha a színész hirtelen kiesne a szerepéből, vagy mintha a rendszer közvetlenül egy nyers, vágatlan tanító hanganyagot játszana be az interfészen keresztül. Ez a szokatlan működés azonnal találgatásokhoz vezetett a modellek tanítási módszereiről, és felerősítette a gyanút, hogy az AI nem feltétlenül a várt módon generálja a válaszait.

A közösségi média felületein elindult diskurzusban a felhasználók azt találgatják, hogy az OpenAI által fejlesztett Advanced Voice Mode a tisztán szintetikus, mesterségesen generált hangok helyett vagy mellett valójában valódi emberi felvételeket is használhat. A kiszivárgottnak tűnő hanganyag ugyanis túlontúl természetesnek és emberinek hatott ahhoz, hogy pusztán algoritmusok terméke legyen. Ez a feltételezés alapjaiban kérdőjelezi meg azt, amit eddig a hangalapú GPT modellek működéséről és a szintetikus hanggenerálás tisztaságáról gondoltunk.

Az eset azonban nemcsak a technológia iránt érdeklődők számára izgalmas, hanem komolyabb kérdéseket is felvet. Az incidens rávilágított a modell tanítóadatait védő úgynevezett zár, vagyis a beépített biztonsági korlátok megbízhatóságának problémájára. Ha a nyers tanító hanganyagok valóban képesek kijutni az interfészen keresztül a végfelhasználókhoz, az azt jelenti, hogy a védelmi mechanizmusok nem nyújtanak százszázalékos biztonságot. Ez a baki figyelmeztetésként szolgálhat az egész iparág számára, hogy a rendkívül gyorsan fejlődő AI technológiák mögött álló biztonsági rendszerek finomhangolása még folyamatos munkát igényel.

A példa hangfelvételen úgy hangzik az AI, mintha egy emberi színész kiesne a szerepéből, vagy mintha nyers tanító hanganyagot hallanánk.
A közösségi média felhasználói azt találgatják, hogy az AVM valódi emberi felvételeket használhat a tisztán szintetikus generálás helyett.
Az eset kérdéseket vetett fel a modell tanítóadatait védő „zár” megbízhatóságával kapcsolatban.
--

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

GPT-5.6 prompting útmutató és új, képernyő-tudatos AI frissítések

8 órája

A HP mesterséges intelligenciája előre jelzi és elhárítja a hardverhibákat

11 órája

AI-ügynökök tanítása szakértői korrekciók alapján

11 órája

Tudj meg többet

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?

AI modellek finomhangolása és egyedi fejlesztése: Lépj túl a generikus megoldásokon!