KYUTAI
A francia Kyutai AI startup elindította „Moshi” nevű hangasszisztensét
Az összefoglaló: A francia Kyutai startup bemutatta Moshit, egy új, „valós idejű” AI hangasszisztenst, amely különféle érzelmekkel és stílusokban képes válaszolni, hasonlóan az OpenAI késleltetett Voice Mode funkciójához.
- A Moshi képes egyszerre figyelni és beszélni, 70 különböző érzelemmel és beszédstílussal a suttogástól az akcentusos beszédig.
- A Kyutai állítása szerint a Moshi az első kiadott „valós idejű hang-alapú AI asszisztens”, 160 ms-os késleltetéssel, ami potenciálisan felülmúlja az OpenAI kínálatát.
- A nonprofit csoport azt tervezi, hogy a következő hetekben open-source módon elérhetővé teszi a kutatást és a modellt; a Moshi jelenleg a Hugging Face-en keresztül próbálható ki.
- A startup 2023-ban indult 324 millió dolláros tőkével, és egy 8 fős kutatócsoport mindössze négy hónap alatt fejlesztette ki a Moshit.
Miért fontos?
A Moshi hatalmas győzelemnek tűnik a francia AI-szcéna számára, és egy újabb figyelemre méltó rivális, amely kikezdi az OpenAI vélt előnyét a mezőny többi részével szemben. Ráadásul az egyedi francia akcentussal biztosan nem lesznek ScarJo-szerű aggályok ezen modell bevezetésekor. ---