A Meta MMS projektje több mint 1100 nyelvre terjeszti ki a beszédelismerést

2023. május 29. · MI Történik? · 1 perc olvasás

A Meta modellek egy családját fejlesztette ki és tette közzé a Massively Multilingual Speech (MMS) projekt keretében, amellyel az AI-t körülbelül 1000 nyelv felismerésére tanították be – ez jelentős ugrás a jelenlegi rendszerekre jellemző 100 nyelvhez képest. Az alacsony erőforrás-igényű nyelvek adatgyűjtéséhez a Meta olyan vallási szövegekhez fordult, mint az Újszövetség, amelyet számos nyelvre lefordítottak és széles körben tanulmányoztak. Több mint 1100 nyelven készítettek felolvasásokból álló adatkészletet, nyelvenként átlagosan 32 órányi adattal. A tesztek során az MMS modellek kedvező eredményeket mutattak az OpenAI Whisper modelljéhez képest, lényegesen alacsonyabb szóhiba-arányt produkálva a FLEURS benchmarkon.

Öntanuló (self-supervised) modelleket tanítottak 500 000 órányi beszédadaton, több mint 1400 nyelven
Az Újszövetség lefordított változatait használták fel címkézett adatok kinyerésére ritka nyelvekhez
Az MMS 18,7-es szóhiba-arányt ért el, szemben a Whisper 44,3-as értékével egy 54 nyelvű benchmarkon
A projekt magában foglalja a beszéd-szöveg, szöveg-beszéd és nyelvfelismerési képességeket
A modelleket és a kódot a GitHubon keresztül tették közzé open-source használatra

Miért fontos?

Ez a technológia lehetővé teszi az AI számára, hogy túllépjen a szöveges interakción, és elkezdjen figyelni és beszélgetni a bolygó szinte minden nyelvi közösségével, áthidalva a biológiai és a digitális síkokat.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A különbségek megértése: Skill-ek, Project-ek, GPT-k, Agent-ek és Plugin-ek

tegnap

A Google frissítette a NotebookLM-et forrás-jóváhagyással és többféle exportálási formátummal

3 napja

Az Alexa for Shopping már egyedi ajándéktárgyakat generál promptok alapján

4 napja

Tudj meg többet

Ingyenes AI eszközök 2026 - Top 15