MISTRAL
A Mistral és az Nvidia kiadta a NeMo-t, a kisméretű, de bivalyerős AI modellt
A Mistral AI és az Nvidia bemutatta a Mistral NeMo-t, egy új, open-source, 12B paraméteres kisméretű nyelvi modellt, amely a legfontosabb benchmarkokon felülmúlja az olyan versenytársakat, mint a Gemma 2 9B és a Llama 3 8B, miközben jelentősen megnövelt kontextusablakot kínál.
- A NeMo 128k tokenes kontextusablakkal rendelkezik, és méretkategóriájában SOTA teljesítményt nyújt a logikai érvelés, a világról szerzett ismeretek és a kódolási pontosság terén.
- A modell kiválóan teljesít a többlépcsős beszélgetésekben, matematikában és a józan észen alapuló érvelésben, így sokoldalúan használható különböző vállalati alkalmazásokhoz.
- A Mistral bemutatta a „Tekken” nevű tokenizálót is, amely több mint 100 nyelven hatékonyabban reprezentálja a szöveget, így 30%-kal több tartalom fér el a kontextusablakban.
- A NeMo-t úgy tervezték, hogy egyetlen NVIDIA L40S, GeForce RTX 4090 vagy RTX 4500 GPU-n is fusson, így nagy teljesítményű AI képességeket tesz elérhetővé a standard üzleti hardvereken.
Miért fontos?
A kisméretű nyelvi modellek népszerűsége egyre nő – és gyorsan közeledünk egy olyan új korszak felé, ahol az AI-megjelenések már nem áldozzák fel a teljesítményt a méret és a sebesség oltárán. A Mistral folytatja lenyűgöző heti bejelentéseit, tovább erősítve az open-source vonalat és felvéve a versenyt az iparág óriásaival. ---