Készíts a saját hangodra betanított text-to-speech audiót

2026. május 23. · MI Történik? · 2 perc olvasás

A technológiai óriás Meta bemutatta a legújabb kutatási projektjét, az AudioBox nevű alapmodellt, amely forradalmasíthatja az audiogenerálást és a mesterséges intelligencia alapú hangszintézist. Ez az innovatív AI eszköz lehetővé teszi a felhasználók számára, hogy teljesen ingyenesen hozzanak létre olyan text-to-speech audiókat, amelyek pontosan úgy hangzanak, mint a saját hangjuk. Az AudioBox nem csupán egy egyszerű felolvasó szoftver, hanem egy komplex kutatási modell, amely a hangstílusok és egyedi jellemzők pontos másolására képes, megnyitva az utat a személyre szabott digitális tartalomgyártás előtt.

Az új generatív AI eszköz kipróbálása rendkívül egyszerű, és nem igényel semmilyen előzetes technikai tudást vagy mélyreható szakmai tapasztalatot a felhasználók részéről. A folyamat elkezdéséhez a tech iránt érdeklődőknek mindössze meg kell látogatniuk a hivatalos AudioBox demó oldalt, majd az oldalon lejjebb görgetve kiválasztaniuk a megfelelő menüpontot. A felületen több lehetőség is rendelkezésre áll: a látogatók kísérletezhetnek előre feltöltött hangmintákkal vagy akár részletes szöveges leírások alapján is generálhatnak auditív tartalmakat, de a legizgalmasabb funkció kétségtelenül a saját hang rögzítése. A Record your voice lehetőségre kattintva a rendszer arra kéri a felhasználót, hogy olvasson fel egy rövid, előre meghatározott mondatot, ami alapján az AI képes feltölteni a hangot a modellbe, hogy megtanulja és modellezze a beszélő egyedi orgánumát.

Miután a rövid felvétel elkészült és a hangminta sikeresen bekerült a modellbe, már csak a kívánt szöveg beírása van hátra. A felhasználónak csupán be kell gépelnie azt a szöveget, amelyet a saját hangján szeretne visszahallani, és a rendszer szinte azonnal munkához lát a rögzítés vagy a mintafelvétel használata után. A folyamat végén az AudioBox két különböző hangfelvételt generál, amelyek hűen tükrözik a felhasználó sajátos hangstílusát és egyedi karakterét. Ez a technológiai fejlesztés kiválóan mutatja be, hogy a Meta új alap kutatási modellje mennyire hatékonyan képes alkalmazkodni az egyéni akusztikus jellemzőkhöz, és mindezt egy bárki számára elérhető, teljesen ingyenes platformon teszi lehetővé.

Látogass el az AudioBox demó oldalára, és görgess le.
Kattints a „Record your voice” lehetőségre a saját hangmintád használatához, vagy használj helyette szöveges leírásokat vagy előre feltöltött hangokat.
Az AudioBox ezután megkér, hogy olvass fel egy rövid mondatot, hogy feltöltsd a hangodat a modellbe.
Írd be a generálni kívánt szöveget a rögzítés (vagy a mintafelvétel használata) után.
Ez minden! Az AudioBox ezután két felvételt generál a te saját hangstílusodban 🎉
--

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Klasszikus anime stílusú képgeneráló prompt

11 órája

Cold Outreach szakértő prompt

12 órája

Így használd a Manus AI-t, hogy a saját hangodon írj LinkedIn-posztokat

14 órája

Tudj meg többet

AI-alapú tudásbázis építése: Saját rendszerező asszisztens létrehozása

Helyi AI futtatása saját gépen: Útmutató az Ollama és LM Studio használatához