A Mistral kiadta a Magistral érvelő modellt, de elmarad a DeepSeek R1 mögött

2025. június 23. · MI Történik? · 1 perc olvasás

A Mistral betanította első érvelő modelljét, a Magistral-t. A modell pontszámai megközelítik a DeepSeek „R1” modelljét, de a matematika és a kódolás fontos területein nem sikerül felülmúlnia azt. A Mistral javára írandó, hogy a kutatási tanulmány alapos elemzést nyújt az érvelés-alapú modellek tanításának összetettségéről, és a tanulmány mellett kiadták a Magistral Small-t is, egy kisméretű modellt, amelyet a közepes méretű Magistral Medium lepárlásával (distillation) tanítottak. A Magistral a Mistral Medium 3 modellre épülve készült. A matematika és kódolási teljesítmény javítása érdekében a Mistral egy 38 000 úgynevezett „aranyközépút” (goldilocks) matematikai problémából („sem túl könnyű, sem túl nehéz a modell számára”), valamint 35 000 kódolási problémából álló adatkészletet állított össze. A Mistral egy „ingyen ebéd” felfedezést is tett: „azt tapasztaltuk, hogy a modellek nemcsak megtartják multimodális képességeiket, hanem váratlanul fejlettebb multimodális érvelési képességeket fejlesztenek ki.”

A Magistral Medium 64,9 pontot ért el az AIME'25 teszten, szemben a DeepSeek R1 70 pontjával.
38 000 „aranyközépút” matematikai feladattal és 35 000 kódolási feladattal tanították.
Tartalmaz egy lepárolt verziót, a Magistral Small-t, a hatékonyabb használat érdekében.
A modell váratlanul javuló multimodális érvelést mutatott a tanítás során.
94,3 pontot ért el a MATH-500-on és 70,8-at a GPQA-n.

Miért fontos?

A Mistral egy elismert, középméretű AI vállalat, amely hozzáfér a legmodernebb chipekhez, mégis a 2025 júniusában kiadott érvelő modellje elmarad a DeepSeek januári R1 modellje mögött. Ez rávilágít az AI élvonalában maradásért folytatott intenzív küzdelemre és annak nehézségeire. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Epicure: Egy többnyelvű AI összetevő-beágyazó modell receptanalízishez

2026. május 28.

Claude Mythos: Az Anthropic állítólag rendkívül erős, még meg nem jelent AI modellje

2026. április 15.

Az Anthropic egy védetlen adatbázison keresztül szivárogtatta ki a nagy teljesítményű Claude Mythos modellt

2026. március 30.

Tudj meg többet

OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép

DeepSeek vs. ChatGPT vs. Claude: Melyik AI gondolkodik a legjobban?