MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Készíts a saját hangodra betanított text-to-speech audiót

A technológiai óriás Meta bemutatta a legújabb kutatási projektjét, az AudioBox nevű alapmodellt, amely forradalmasíthatja az audiogenerálást és a mesterséges intelligencia alapú hangszintézist. Ez az innovatív AI eszköz lehetővé teszi a felhasználók számára, hogy teljesen ingyenesen hozzanak létre olyan text-to-speech audiókat, amelyek pontosan úgy hangzanak, mint a saját hangjuk. Az AudioBox nem csupán egy egyszerű felolvasó szoftver, hanem egy komplex kutatási modell, amely a hangstílusok és egyedi jellemzők pontos másolására képes, megnyitva az utat a személyre szabott digitális tartalomgyártás előtt.

Az új generatív AI eszköz kipróbálása rendkívül egyszerű, és nem igényel semmilyen előzetes technikai tudást vagy mélyreható szakmai tapasztalatot a felhasználók részéről. A folyamat elkezdéséhez a tech iránt érdeklődőknek mindössze meg kell látogatniuk a hivatalos AudioBox demó oldalt, majd az oldalon lejjebb görgetve kiválasztaniuk a megfelelő menüpontot. A felületen több lehetőség is rendelkezésre áll: a látogatók kísérletezhetnek előre feltöltött hangmintákkal vagy akár részletes szöveges leírások alapján is generálhatnak auditív tartalmakat, de a legizgalmasabb funkció kétségtelenül a saját hang rögzítése. A Record your voice lehetőségre kattintva a rendszer arra kéri a felhasználót, hogy olvasson fel egy rövid, előre meghatározott mondatot, ami alapján az AI képes feltölteni a hangot a modellbe, hogy megtanulja és modellezze a beszélő egyedi orgánumát.

Miután a rövid felvétel elkészült és a hangminta sikeresen bekerült a modellbe, már csak a kívánt szöveg beírása van hátra. A felhasználónak csupán be kell gépelnie azt a szöveget, amelyet a saját hangján szeretne visszahallani, és a rendszer szinte azonnal munkához lát a rögzítés vagy a mintafelvétel használata után. A folyamat végén az AudioBox két különböző hangfelvételt generál, amelyek hűen tükrözik a felhasználó sajátos hangstílusát és egyedi karakterét. Ez a technológiai fejlesztés kiválóan mutatja be, hogy a Meta új alap kutatási modellje mennyire hatékonyan képes alkalmazkodni az egyéni akusztikus jellemzőkhöz, és mindezt egy bárki számára elérhető, teljesen ingyenes platformon teszi lehetővé.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Claude Code új dinamikus munkafolyamatainak használata tömeges, összehangolt AI feladatokhoz
2 napja
Térképezze fel, ki jár jól, mielőtt AI-projekteket indítana
3 napja
Térképezze fel az érdekelt felek számára rejlő előnyöket az AI-projektek elindítása előtt
4 napja
Tudj meg többet
Helyi AI futtatása saját gépen: Útmutató az Ollama és LM Studio használatához
Saját AI asszisztens készítése: Útmutató a Custom GPTs és Claude Projects használatához