MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI hang AI-ja személyiségfokozással

Az OpenAI elindította következő generációs API-alapú audiomodelljeit a szövegfelolvasáshoz és a beszédfelismeréshez, lehetőséget adva a fejlesztőknek az AI beszédstílusainak testreszabására szövegen keresztül, és javított beszédfelismerést biztosítva több nyelven.
Miért fontos?

Az AI hangügynököket hamarosan mindenféle alkalmazásba és platformba integrálják – és az, hogy szöveges parancsokkal testreszabhatók a kimenetek, óriási lehetőséget nyit a változatosabb, természetesebb AI interakciók előtt. Ezek az OpenAI demók azonban legalábbis egyelőre nem tűnnek olyan emberinek, mint az olyan hangalapú riválisok, mint a Sesame és az ElevenLabs.

Eredeti forrás megtekintése (angol) →