ChatTTS: Nyílt forráskódú Text-to-Speech társalgási AI asszisztensekre optimalizálva
Megérkezett a text-to-speech technológia új áttörése: a ChatTTS. Kifejezetten párbeszéd-alapú forgatókönyvekhez, például LLM asszisztensekhez tervezték; a ChatTTS kitolja a társalgási AI határait a természetes, kifejező beszéd generálásának képességével. A természetes beszédminták előrejelzésére és reprodukálására való képessége felülmúlja számos nyílt forráskódú TTS modellét, emberibb interakciót biztosítva a felhasználók számára.
- Kifejezetten több beszélős párbeszéd-feladatokra optimalizálva
- Finomhangolt prozódia-vezérlést tesz lehetővé, beleértve a szüneteket, nevetést és közbeszólásokat
- Több mint 100 000 órányi angol és kínai hanganyagon tanítva
- Nyílt forráskódú kutatási célokra, a szintetizált beszéd kifejezőerejének fokozása érdekében