A Mistral és az Nvidia kiadta a NeMo-t, a kisméretű, de bivalyerős AI modellt

MISTRAL

A Mistral és az Nvidia kiadta a NeMo-t, a kisméretű, de bivalyerős AI modellt

2024. július 19. · MI Történik? · 1 perc olvasás

A Mistral AI és az Nvidia bemutatta a Mistral NeMo-t, egy új, open-source, 12B paraméteres kisméretű nyelvi modellt, amely a legfontosabb benchmarkokon felülmúlja az olyan versenytársakat, mint a Gemma 2 9B és a Llama 3 8B, miközben jelentősen megnövelt kontextusablakot kínál.

A NeMo 128k tokenes kontextusablakkal rendelkezik, és méretkategóriájában SOTA teljesítményt nyújt a logikai érvelés, a világról szerzett ismeretek és a kódolási pontosság terén.
A modell kiválóan teljesít a többlépcsős beszélgetésekben, matematikában és a józan észen alapuló érvelésben, így sokoldalúan használható különböző vállalati alkalmazásokhoz.
A Mistral bemutatta a „Tekken” nevű tokenizálót is, amely több mint 100 nyelven hatékonyabban reprezentálja a szöveget, így 30%-kal több tartalom fér el a kontextusablakban.
A NeMo-t úgy tervezték, hogy egyetlen NVIDIA L40S, GeForce RTX 4090 vagy RTX 4500 GPU-n is fusson, így nagy teljesítményű AI képességeket tesz elérhetővé a standard üzleti hardvereken.

Miért fontos?

A kisméretű nyelvi modellek népszerűsége egyre nő – és gyorsan közeledünk egy olyan új korszak felé, ahol az AI-megjelenések már nem áldozzák fel a teljesítményt a méret és a sebesség oltárán. A Mistral folytatja lenyűgöző heti bejelentéseit, tovább erősítve az open-source vonalat és felvéve a versenyt az iparág óriásaival. ---

Eredeti forrás megtekintése (angol) →