MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Mistral kiadta a Magistral érvelő modellt, de elmarad a DeepSeek R1 mögött

A Mistral betanította első érvelő modelljét, a Magistral-t. A modell pontszámai megközelítik a DeepSeek „R1” modelljét, de a matematika és a kódolás fontos területein nem sikerül felülmúlnia azt. A Mistral javára írandó, hogy a kutatási tanulmány alapos elemzést nyújt az érvelés-alapú modellek tanításának összetettségéről, és a tanulmány mellett kiadták a Magistral Small-t is, egy kisméretű modellt, amelyet a közepes méretű Magistral Medium lepárlásával (distillation) tanítottak. A Magistral a Mistral Medium 3 modellre épülve készült. A matematika és kódolási teljesítmény javítása érdekében a Mistral egy 38 000 úgynevezett „aranyközépút” (goldilocks) matematikai problémából („sem túl könnyű, sem túl nehéz a modell számára”), valamint 35 000 kódolási problémából álló adatkészletet állított össze. A Mistral egy „ingyen ebéd” felfedezést is tett: „azt tapasztaltuk, hogy a modellek nemcsak megtartják multimodális képességeiket, hanem váratlanul fejlettebb multimodális érvelési képességeket fejlesztenek ki.”
Miért fontos?

A Mistral egy elismert, középméretű AI vállalat, amely hozzáfér a legmodernebb chipekhez, mégis a 2025 júniusában kiadott érvelő modellje elmarad a DeepSeek januári R1 modellje mögött. Ez rávilágít az AI élvonalában maradásért folytatott intenzív küzdelemre és annak nehézségeire. ---

Eredeti forrás megtekintése (angol) →