Az OpenAI kiadta a Whisper v3-at a továbbfejlesztett automatikus beszédfelismerésért
A Whisper large-v3 az OpenAI következő generációs automatikus beszédfelismerő (ASR) modellje, amely minden nyelven jobb teljesítményt nyújt. A Whisper 2022. szeptemberi open-source megjelenése mélyreható hatást gyakorolt az iparágra, és ez a frissítés nagyobb pontossággal folytatja ezt a lendületet.
- Javult teljesítmény és alacsonyabb hibaarány (WER) jellemzi minden nyelven
- Azonnal elérhető a Whisper csomagon keresztül a GitHub-on
- A Whisper v3 API-hozzáférése a közeljövőben várható
Miért fontos?
A Whisper v3 integrálása az OpenAI API ökoszisztémába elérhetőbbé teszi a kifinomult beszéd-szöveg technológiát a fejlesztők számára. Ez a lépés elősegíti a beszéd-szöveg piac kommoditizálódását, lehetővé téve a felhasználók és alkalmazások szélesebb körét. ---