MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Nvidia nyílt forráskódúvá tette a nagy pontosságú Parakeet V2 beszédfelismerő modellt

Az Nvidia éppen most tette közzé a Parakeet V2-t, egy új, nagy teljesítményű, open-source automatikus beszédfelismerő (ASR) modellt, amely képes egy órányi hanganyagot egyetlen másodperc alatt átírni, miközben kereskedelmi szintű pontosságot ér el.
Miért fontos?

Az Nvidia továbbra is nemcsak a chipek piacát uralja, hanem nagy teljesítményű és nagyrészt open-source modelleket is kiad. A fárasztó gépelések ideje lejárt, és ez a nyílt, mégis élvonalbeli ASR modell jelentősen lecsökkenti a belépési küszöböt a fejlett beszédalkalmazások fejlesztése előtt. ---

Eredeti forrás megtekintése (angol) →