MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az ElevenLabs elindította a Reader alkalmazást, amellyel bármilyen szöveges tartalom „podcastosítható”

Az ElevenLabs, a mesterséges intelligencia alapú hangtechnológia egyik vezető szereplője, egy izgalmas fejlesztéssel rukkolt elő: elindították a Reader alkalmazást, amely forradalmasíthatja az írott tartalmak fogyasztását. Az új applikáció lényege, hogy gyakorlatilag bármilyen szöveges anyagot – legyen szó online cikkekről, PDF dokumentumokról vagy e-könyvekről – képes természetes hangzású beszéddé alakítani, így gyakorlatilag bármilyen írott tartalmat podcasttá varázsolhatunk. A június óta elérhető alkalmazás nemrég jelentős frissítésen esett át, amelynek köszönhetően már 32 nyelven támogatja a szövegfelolvasást, miközben az ElevenLabs hatalmas hangtárából válogathatunk, sőt, akár ikonikus hírességek jellegzetes hangjait is kiválaszthatjuk narrátorként.

A technológiai háttérben az ElevenLabs saját, rendkívül fejlett Turbo v2.5 AI hangmodellje áll, amely garantálja a kiváló minőségű és élethű beszédhangot. Ez az innovatív technológia nem csupán az alkalmazásban érhető el, hanem API-n keresztül más fejlesztők és vállalatok is integrálhatják saját termékeikbe. Már számos népszerű platform használja ezt a megoldást hangalapú interakciókhoz, köztük a Perplexity vagy a Rabbit r1 eszköz is. Fontos üzleti döntés a cég részéről, hogy az API szolgáltatás díját 50 százalékkal csökkentették, ami jelentősen növeli a hozzáférhetőséget, és minden eddiginél megfizethetőbbé teszi a kiváló minőségű szövegfelolvasás bevezetését a legkülönfélébb digitális termékek és alkalmazások számára.

Az alkalmazás rugalmassága és a hangok széles választéka új távlatokat nyit meg a tartalomfogyasztásban: Judy Garland hangján hallgathatunk meg egy biológia leckét, James Dean narrálhatja kedvenc szerelmes regényünket, vagy akár Sir Laurence Olivier olvashatja fel számunkra a napi hírleveleket. Ez a megoldás nem csupán technológiai bravúr, hanem komoly társadalmi jelentőséggel is bír. Az ElevenLabs adatai szerint a tartalomkészítők, köztük a nagy YouTuberek is előszeretettel használják a szinkronszolgáltatásaikat, hogy tartalmaikat új régiókra terjesszék ki, miközben az eredeti hangjukat klónozva őrzik meg hitelességüket. Emellett a technológia különösen nagy segítséget jelenthet a diszlexiával élő emberek számára, hiszen a becslések szerint a lakosság mintegy 20 százalékát érintő nehézség leküzdésében az olvasás helyetti hallgatási élmény jelentős minőségi ugrást jelent. Azáltal, hogy a felhasználók saját nyelvükön, bárhol az interneten elérhetik a tartalmakat, az ElevenLabs új szintre emeli az elköteleződést és a digitális kommunikáció hatékonyságát, ami egyértelmű előnyt jelent mind a tartalomkészítők, mind a fogyasztók számára.

Miért fontos?

Az ElevenLabs megosztotta, hogyan használják a nagy YouTuberek a szinkronszolgáltatásaikat, hogy tartalmaikat új régiókra terjesszék ki, olyan hangokkal, amelyek ténylegesen úgy hangzanak, mint ők (az ElevenLabs hangklónozási képességének köszönhetően). Ja, és mellesleg, becslések szerint a lakosság akár 20%-a is diszlexiás lehet. Tehát az, hogy az embereknek lehetőséget biztosítunk a tartalom meghallgatására (olvasás helyett), saját nyelvükön, bárhol az interneten, csak növelheti az elköteleződést és a kommunikációt. Win-win, ha minket kérdezel! ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
NYT-újságíró AI segítségével, ingatlanügynök nélkül adta el házát
most
Az Anthropic megerősítette, hogy a nagyteljesítményű Mythos modell hamarosan elérhető lesz a nyilvánosság számára
most
Az ElevenLabs Music v2 lehetővé teszi a szám közbeni műfajváltást és a gyors repet
most
Tudj meg többet
AI hanggenerálás és zeneszerzés: Útmutató a Suno, Udio és ElevenLabs használatához
AI a tartalomgyártásban: Hogyan készíts profi videókat és prezentációkat percek alatt