AI MODELLEK
A Mistral kiadta a Magistral érvelő modellt, de elmarad a DeepSeek R1 mögött
A Mistral betanította első érvelő modelljét, a Magistral-t. A modell pontszámai megközelítik a DeepSeek „R1” modelljét, de a matematika és a kódolás fontos területein nem sikerül felülmúlnia azt. A Mistral javára írandó, hogy a kutatási tanulmány alapos elemzést nyújt az érvelés-alapú modellek tanításának összetettségéről, és a tanulmány mellett kiadták a Magistral Small-t is, egy kisméretű modellt, amelyet a közepes méretű Magistral Medium lepárlásával (distillation) tanítottak. A Magistral a Mistral Medium 3 modellre épülve készült. A matematika és kódolási teljesítmény javítása érdekében a Mistral egy 38 000 úgynevezett „aranyközépút” (goldilocks) matematikai problémából („sem túl könnyű, sem túl nehéz a modell számára”), valamint 35 000 kódolási problémából álló adatkészletet állított össze. A Mistral egy „ingyen ebéd” felfedezést is tett: „azt tapasztaltuk, hogy a modellek nemcsak megtartják multimodális képességeiket, hanem váratlanul fejlettebb multimodális érvelési képességeket fejlesztenek ki.”
- A Magistral Medium 64,9 pontot ért el az AIME'25 teszten, szemben a DeepSeek R1 70 pontjával.
- 38 000 „aranyközépút” matematikai feladattal és 35 000 kódolási feladattal tanították.
- Tartalmaz egy lepárolt verziót, a Magistral Small-t, a hatékonyabb használat érdekében.
- A modell váratlanul javuló multimodális érvelést mutatott a tanítás során.
- 94,3 pontot ért el a MATH-500-on és 70,8-at a GPQA-n.
Miért fontos?
A Mistral egy elismert, középméretű AI vállalat, amely hozzáfér a legmodernebb chipekhez, mégis a 2025 júniusában kiadott érvelő modellje elmarad a DeepSeek januári R1 modellje mögött. Ez rávilágít az AI élvonalában maradásért folytatott intenzív küzdelemre és annak nehézségeire. ---