MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az ElevenLabs bemutatta speech-to-speech átalakítóját

Az ElevenLabs, a mesterséges intelligencián alapuló hangtechnológiai szektor egyik meghatározó startupja, a napokban hivatalosan is bemutatta legújabb, kifejezetten izgalmas fejlesztését, egy AI alapú speech-to-speech átalakítót. Az új eszköz lehetővé teszi a felhasználók számára, hogy valós időben, könnyedén változtassák meg saját hangjukat, miközben az eredeti beszéd érzelmi töltete, intonációja és ritmusa is megmarad. A vállalat ezzel a lépéssel jelentős mértékben demokratizálja a professzionális hangmanipulációt, hiszen a technológia immár bárki számára ingyenesen elérhetővé vált, legyen szó tartalomgyártókról vagy egyszerű felhasználókról.

A technológia működésének lényege, hogy a rendszer nem csupán a szövegfelolvasásra (text-to-speech) fókuszál, hanem a bemeneti hangminta stilisztikai jegyeit ülteti át egy választott célhangra. Az alkalmazás segítségével a felhasználók egyetlen kattintással hozhatnak létre egyedi hangkaraktereket, amelyek kiválóan adaptálhatóak különféle kreatív projektekhez. Ez a fejlesztés rendkívül nagy potenciállal bír a modern médiaiparban, hiszen a videójátékok fejlesztői, a videós tartalomkészítők és a podcasterek számára is új kapukat nyit meg a hangdizájn területén. A megoldás rugalmassága révén egyetlen hangmintából kiindulva végtelen számú variáció hozható létre, ami drasztikusan lerövidítheti a produkciós folyamatokat.

Az ElevenLabs újítása különösen azért számít mérföldkőnek az AI iparágban, mert eddig az ilyen szintű hangmanipulációhoz vagy drága stúdióeszközökre, vagy bonyolultabb, szakértelmet igénylő szoftverekre volt szükség. A vállalat által kínált megoldás azonban a felhasználói élményt helyezi előtérbe, így az egyszerű kezelhetőség és a magas minőségű kimenet kombinációja komoly versenyelőnyt jelenthet a piacon. A technológia elterjedésével várhatóan még több kreatív tartalom születik majd, ahol a hangszín és a karakterek rugalmas alakítása központi szerepet kap, tovább erősítve az AI eszközök integrációját a mindennapi alkotómunkában. Ez a fejlesztés is jól mutatja, hogy milyen gyors ütemben halad az innováció az audió technológiák terén, ahol a mesterséges intelligencia immár nemcsak szöveget generál, hanem a beszéd legfinomabb árnyalatainak kezelésére is képes.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Salesforce bemutatta az Agentforce Testing Centert az AI ágensek értékeléséhez
2026. május 23.
Az OpenAI mérnökei véletlenül bizonyítékokat töröltek a tanítási adatokkal kapcsolatos perben
2026. május 23.
A Samsung bemutatta a Gauss2 következő generációs multimodális AI modelljét
2026. május 23.
Tudj meg többet
AI hanggenerálás és zeneszerzés: Útmutató a Suno, Udio és ElevenLabs használatához