Debütált a Mistral Magistral érvelési modellje, de elmarad a DeepSeek-R1 benchmarkjaitól

AI MODELLEK

Debütált a Mistral Magistral érvelési modellje, de elmarad a DeepSeek-R1 benchmarkjaitól

2025. június 23. · MI Történik? · 1 perc olvasás

A Mistral betanította első érvelési modelljét, a Magistralt, amely az olyan érvelés-intenzív modellek teljesítményszintjét célozza meg, mint a DeepSeek-R1. Bár a modell lenyűgöző pontszámokat ér el, jelenleg elmarad a DeepSeek-R1 mögött a kritikus matematikai és kódolási benchmarkok (például AIME'25 és MATH-500) tekintetében. A Mistral közzétett egy tanulmányt az ilyen modellek tanításának összetettségéről, és bemutatta a Magistral Small-t is, amely a nagyobb Magistral Medium modellből készült lepárlással (distillation).

A Mistral első lépése a megerősítéses tanuláson alapuló érvelési rendszerek felé
38 ezer válogatott matematikai és 35 ezer kódolási feladaton tanítva
A Mistral Medium 64,9 pontot ért el az AIME'25 teszten, szemben a DeepSeek R1 70 pontjával
A modell a tanítás során váratlanul fejlett multimodális érvelési képességeket fejlesztett ki
A kiadás tartalmazza a kutatási dokumentációt és a lepárolt Small verziót is

Miért fontos?

A Mistral egy elismert, közepes méretű AI vállalat, amely hozzáfér a legmodernebb chipekhez. Ezért meglepő látni, hogy a 2025 júniusában kiadott érvelési modellje elmarad a DeepSeek januári R1 modelljének teljesítményétől, ami rávilágít arra, milyen rendkívül nehéz az élvonalban maradni. ---

Eredeti forrás megtekintése (angol) →