Az OpenAI bemutatta a Voice Engine-t, amely 15 másodperces minták alapján képes emberi hangok reprodukálására

2026. május 24. · MI Történik? · 2 perc olvasás

Az OpenAI legújabb fejlesztése, a Voice Engine névre keresztelt generatív audio eszköz forradalmasíthatja az emberi kommunikációt. A technológia képes mindössze egy 15 másodperces hangminta felhasználásával pontosan reprodukálni egy adott személy hangját, megőrizve annak egyedi tónusait és sajátosságait. A fejlesztés lehetővé teszi, hogy bárki saját hangján szólaljon meg olyan idegen nyelveken is, mint a francia, a mandarin vagy a japán, még akkor is, ha az adott nyelvet sosem tanulta. Ez az innováció új kapukat nyithat meg a digitális tartalmak globális elérhetőségében és a személyre szabott kommunikációban.

A technológia alkalmazási lehetőségei rendkívül széleskörűek és sokrétűek. A Voice Engine segítségével könnyebbé válhat a videók és podcastok fordítása, ami eltüntetheti a nyelvi akadályokat a tartalomfogyasztás során. A marketing és oktatás területén emberszerű, hiteles avatarok hozhatók létre, amelyek vonzóbbá tehetik az oktatóanyagokat vagy a reklámokat. Különösen ígéretes a technológia humánus felhasználása: a Brown University kutatói például már vizsgálják, hogyan segíthet az eszköz a degeneratív beszédzavarral küzdő betegeknek abban, hogy visszanyerjék saját, eredeti hangjukat, vagy új lehetőséget adjon a nem beszélő embereknek a kommunikációra. Emellett a Voice Engine támogathatja a gyerekeket és az olvasási nehézségekkel küzdőket is egy természetes hangon megszólaló, segítő digitális társ révén.

Az OpenAI ugyanakkor felelősségteljesen és óvatosan közelíti meg a technológia piaci bevezetését, figyelembe véve a visszaélések lehetőségét. A Voice Engine komoly biztonsági kockázatokat rejthet, különösen egy választási évben, amikor a deepfake hangfelvételek akár félrevezetésre is felhasználhatók. A visszaélések megelőzése érdekében az OpenAI szigorú biztonsági intézkedéseket vezet be: digitális vízjelet helyeznek el a Voice Engine által generált hangfelvételeken, így a hallgatók számára egyértelműen beazonosítható lesz, ha mesterségesen létrehozott tartalommal találkoznak. Emellett a vállalat korlátozásokat alkalmaz a politikusok és hírességek hangjának felhasználásával kapcsolatban, hogy megakadályozzák a technológia káros vagy megtévesztő alkalmazását. A fejlesztés pontos megjelenése még várat magára, a vállalat egyelőre fokozatosan és körültekintően halad a technológia nyilvánosságra hozatalával.

Videók és podcastok fordítása más nyelvekre
Emberszerű avatarok létrehozása termékmarketinghez vagy oktatóanyagokhoz
Új kommunikációs eszköz biztosítása a nem beszélő, vagy beszédképességüket elvesztett emberek számára

Miért fontos?

Az OpenAI közölte, hogy digitális vízjelet hoz létre, amely figyelmezteti a hallgatókat, ha egy hangfelvétel a Voice Engine-nel készült. Emellett korlátozhatják bizonyos hangok használatát, például politikusokét és hírességekét. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az OpenAI finanszírozási rekordot döntött az AGI-hoz vezető úton

2026. május 24.

A heti Microsoft Build konferencia legfontosabb AI-bejelentései

2026. május 24.

Az OpenAI és a Meta megjelöli az AI által generált képeket a deepfake-ek elleni küzdelem jegyében

2026. május 24.

Tudj meg többet

OpenAI Sora: AI videógenerálás – minden, amit tudni kell

OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép