MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Véletlenül kiszivárogtatta a ChatGPT Advanced Voice Mode a tanítóadatait?

Véletlenül kiszivárogtatta a ChatGPT Advanced Voice Mode a tanítóadatait? Ez a kérdés tartja lázban jelenleg a technológiai világot, miután a felhasználók rendkívül furcsa és váratlan viselkedésről számoltak be az OpenAI legújabb fejlesztésével kapcsolatban. Az Advanced Voice Mode (AVM) használata során tapasztalt jelenségek ugyanis arra utalhatnak, hogy a modell akaratlanul is részleteket fed fel azokból a tanítóadatokból, amelyek alapján felkészítették a működésre. Az eset gyorsan elterjedt a tech közösségben, és komoly vitákat indított el az AI rendszerek mögött álló technológiákról.

A találgatások bázisát egy nemrégiben a Redditen megosztott konkrét példa adja, amelyben egy egészen megdöbbentő hangfelvétel hallható. Ezen a felvételen a ChatGPT Advanced Voice Mode funkciója úgy szólal meg, mintha egy valódi emberi szinkronszínész beszélne a színfalak mögött. A hallottak alapján a felhasználók úgy értékelték a helyzetet, mintha a színész hirtelen kiesne a szerepéből, vagy mintha a rendszer közvetlenül egy nyers, vágatlan tanító hanganyagot játszana be az interfészen keresztül. Ez a szokatlan működés azonnal találgatásokhoz vezetett a modellek tanítási módszereiről, és felerősítette a gyanút, hogy az AI nem feltétlenül a várt módon generálja a válaszait.

A közösségi média felületein elindult diskurzusban a felhasználók azt találgatják, hogy az OpenAI által fejlesztett Advanced Voice Mode a tisztán szintetikus, mesterségesen generált hangok helyett vagy mellett valójában valódi emberi felvételeket is használhat. A kiszivárgottnak tűnő hanganyag ugyanis túlontúl természetesnek és emberinek hatott ahhoz, hogy pusztán algoritmusok terméke legyen. Ez a feltételezés alapjaiban kérdőjelezi meg azt, amit eddig a hangalapú GPT modellek működéséről és a szintetikus hanggenerálás tisztaságáról gondoltunk.

Az eset azonban nemcsak a technológia iránt érdeklődők számára izgalmas, hanem komolyabb kérdéseket is felvet. Az incidens rávilágított a modell tanítóadatait védő úgynevezett zár, vagyis a beépített biztonsági korlátok megbízhatóságának problémájára. Ha a nyers tanító hanganyagok valóban képesek kijutni az interfészen keresztül a végfelhasználókhoz, az azt jelenti, hogy a védelmi mechanizmusok nem nyújtanak százszázalékos biztonságot. Ez a baki figyelmeztetésként szolgálhat az egész iparág számára, hogy a rendkívül gyorsan fejlődő AI technológiák mögött álló biztonsági rendszerek finomhangolása még folyamatos munkát igényel.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
NYT-újságíró AI segítségével, ingatlanügynök nélkül adta el házát
most
Az Anthropic megerősítette, hogy a nagyteljesítményű Mythos modell hamarosan elérhető lesz a nyilvánosság számára
most
Az ElevenLabs Music v2 lehetővé teszi a szám közbeni műfajváltást és a gyors repet
1 órája
Tudj meg többet
Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?
AI keresőoptimalizálás (GEO): Hogyan kerülj be a ChatGPT és a Perplexity válaszaiba?