MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Amazon bemutatta a 100 000 órányi beszéden tanított Base TTS-t

Az Amazon bemutatta a Base TTS-t, az eddigi legnagyobb text-to-speech modellt. A több mint 100 000 órányi beszédadaton tanított modell a beszédmintézis természetességének új szintjét éri el. Egy újszerű tokenizációs módszert alkalmaz, amely lehetővé teszi az emberi beszéd árnyalatainak minden eddigi modellnél hatékonyabb rögzítését.
Miért fontos?

A TTS modellek méretének növelése élethűbb AI asszisztensekhez és digitális hangokhoz vezet, ami potenciálisan megkülönböztethetetlenné teszi a szintetikus beszédet az emberi felvételektől. ---

Eredeti forrás megtekintése (angol) →