Készíts a saját hangodra betanított text-to-speech audiót
A technológiai óriás Meta bemutatta a legújabb kutatási projektjét, az AudioBox nevű alapmodellt, amely forradalmasíthatja az audiogenerálást és a mesterséges intelligencia alapú hangszintézist. Ez az innovatív AI eszköz lehetővé teszi a felhasználók számára, hogy teljesen ingyenesen hozzanak létre olyan text-to-speech audiókat, amelyek pontosan úgy hangzanak, mint a saját hangjuk. Az AudioBox nem csupán egy egyszerű felolvasó szoftver, hanem egy komplex kutatási modell, amely a hangstílusok és egyedi jellemzők pontos másolására képes, megnyitva az utat a személyre szabott digitális tartalomgyártás előtt.
Az új generatív AI eszköz kipróbálása rendkívül egyszerű, és nem igényel semmilyen előzetes technikai tudást vagy mélyreható szakmai tapasztalatot a felhasználók részéről. A folyamat elkezdéséhez a tech iránt érdeklődőknek mindössze meg kell látogatniuk a hivatalos AudioBox demó oldalt, majd az oldalon lejjebb görgetve kiválasztaniuk a megfelelő menüpontot. A felületen több lehetőség is rendelkezésre áll: a látogatók kísérletezhetnek előre feltöltött hangmintákkal vagy akár részletes szöveges leírások alapján is generálhatnak auditív tartalmakat, de a legizgalmasabb funkció kétségtelenül a saját hang rögzítése. A Record your voice lehetőségre kattintva a rendszer arra kéri a felhasználót, hogy olvasson fel egy rövid, előre meghatározott mondatot, ami alapján az AI képes feltölteni a hangot a modellbe, hogy megtanulja és modellezze a beszélő egyedi orgánumát.
Miután a rövid felvétel elkészült és a hangminta sikeresen bekerült a modellbe, már csak a kívánt szöveg beírása van hátra. A felhasználónak csupán be kell gépelnie azt a szöveget, amelyet a saját hangján szeretne visszahallani, és a rendszer szinte azonnal munkához lát a rögzítés vagy a mintafelvétel használata után. A folyamat végén az AudioBox két különböző hangfelvételt generál, amelyek hűen tükrözik a felhasználó sajátos hangstílusát és egyedi karakterét. Ez a technológiai fejlesztés kiválóan mutatja be, hogy a Meta új alap kutatási modellje mennyire hatékonyan képes alkalmazkodni az egyéni akusztikus jellemzőkhöz, és mindezt egy bárki számára elérhető, teljesen ingyenes platformon teszi lehetővé.
- Látogass el az AudioBox demó oldalára, és görgess le.
- Kattints a „Record your voice” lehetőségre a saját hangmintád használatához, vagy használj helyette szöveges leírásokat vagy előre feltöltött hangokat.
- Az AudioBox ezután megkér, hogy olvass fel egy rövid mondatot, hogy feltöltsd a hangodat a modellbe.
- Írd be a generálni kívánt szöveget a rögzítés (vagy a mintafelvétel használata) után.
- Ez minden! Az AudioBox ezután két felvételt generál a te saját hangstílusodban 🎉
- --