AI ESZKÖZÖK
A Meta MMS projektje több mint 1100 nyelvre terjeszti ki a beszédelismerést
A Meta modellek egy családját fejlesztette ki és tette közzé a Massively Multilingual Speech (MMS) projekt keretében, amellyel az AI-t körülbelül 1000 nyelv felismerésére tanították be – ez jelentős ugrás a jelenlegi rendszerekre jellemző 100 nyelvhez képest. Az alacsony erőforrás-igényű nyelvek adatgyűjtéséhez a Meta olyan vallási szövegekhez fordult, mint az Újszövetség, amelyet számos nyelvre lefordítottak és széles körben tanulmányoztak. Több mint 1100 nyelven készítettek felolvasásokból álló adatkészletet, nyelvenként átlagosan 32 órányi adattal. A tesztek során az MMS modellek kedvező eredményeket mutattak az OpenAI Whisper modelljéhez képest, lényegesen alacsonyabb szóhiba-arányt produkálva a FLEURS benchmarkon.
- Öntanuló (self-supervised) modelleket tanítottak 500 000 órányi beszédadaton, több mint 1400 nyelven
- Az Újszövetség lefordított változatait használták fel címkézett adatok kinyerésére ritka nyelvekhez
- Az MMS 18,7-es szóhiba-arányt ért el, szemben a Whisper 44,3-as értékével egy 54 nyelvű benchmarkon
- A projekt magában foglalja a beszéd-szöveg, szöveg-beszéd és nyelvfelismerési képességeket
- A modelleket és a kódot a GitHubon keresztül tették közzé open-source használatra
Miért fontos?
Ez a technológia lehetővé teszi az AI számára, hogy túllépjen a szöveges interakción, és elkezdjen figyelni és beszélgetni a bolygó szinte minden nyelvi közösségével, áthidalva a biológiai és a digitális síkokat.