AI MODELS
Az IBM Granite Speech modellje az élre tört az OpenASR ranglistáján
Az IBM új Granite Speech modellje egy egyedi, kétlépcsős (two-pass) kialakítást használ, amely elválasztja az átírást az utólagos feldolgozástól. Ez az architekturális döntés lehetővé tette számára, hogy vezető helyezéseket érjen el az OpenASR ranglistáján, amely az automatikus beszédfelismerő modellek teljesítményét követi. A modellt több európai nyelv átírására és fordítására tervezték, nagy teljesítményű, nyílt alternatívát kínálva a zárt forráskódú beszéd-API-kkal szemben.
- Jelenleg a 2. és 3. helyet foglalja el a Hugging Face OpenASR ranglistáján.
- Kétlépcsős kialakítással rendelkezik a pontosság és az átírást követő feladatok optimalizálása érdekében.
- Támogatja az angol, francia, német, spanyol és portugál nyelveket a beszéd-szöveg (STT) átalakításhoz.
- Fordítási lehetőséget biztosít angol nyelvre és angolról.
- Teljes dokumentációval és az architektúrát részletező technikai fehér könyvvel (white paper) együtt jelent meg.
Miért fontos?
Miért fontos: A zárt rendszerekkel vetekedő open-source beszédmodellek elengedhetetlenek a fejlesztők számára, akik adatvédelmi fókuszú vagy helyben futtatott hangalapú alkalmazásokat építenek.