AI MODELLEK
Az Alibaba kiadta a Babel többnyelvű modelljeit, amelyek a világ népességének 90%-át lefedik
Az Alibaba megjelentette a „Babel” nevet viselő két új, nyílt hozzáférésű nyelvi modelljét, amelyeket 25 nyelv támogatására terveztek; ezek összesen mintegy 7 milliárd beszélőt szolgálnak ki világszerte. A Babel egy 9 milliárd paraméteres változatban érhető el a hatékony többnyelvű következtetéshez (inference), valamint egy nagy, 83 milliárdos modellben, amely új mércét állít fel vezető nyílt többnyelvű LLM-ként. Az Alibaba közölte, hogy jelentős hangsúlyt fektettek az adattisztítási folyamat optimalizálására, és LLM-alapú szűrést alkalmaztak a tanítási adatok minőségének maximalizálása érdekében.
- A Babel-9B modellt hatékony helyi telepítésre és kutatásra tervezték.
- A Babel-83B versenyképes olyan széles körben használt modellekkel, mint a GPT-4o és a Llama3.1-70B.
- A támogatott nyelvek között szerepel az angol, kínai, hindi, spanyol, arab, szuahéli, filippínó, tamil, vietnámi és további 16 nyelv.
- A Babel-9B versenyképes az MMLU, XNLI és Flores-200 teszteken a Gemma2-9B és a Llama3.1-8B modellekkel szemben.
Miért fontos?
Ahogy a Google példája mutatja, nagy érték rejlik abban, ha valami univerzális felületté válik. Ha az emberek bizonyos régiókból származó fordítómodelleket kezdenek el alapértelmezettként használni, az finom, másodlagos kulturális hatásokkal járhat arra nézve, hogyan jelennek meg a különböző kultúrák és árnyalatok a globális kommunikációban.