AI MODELLEK
Debütált a Mistral Magistral érvelési modellje, de elmarad a DeepSeek-R1 benchmarkjaitól
A Mistral betanította első érvelési modelljét, a Magistralt, amely az olyan érvelés-intenzív modellek teljesítményszintjét célozza meg, mint a DeepSeek-R1. Bár a modell lenyűgöző pontszámokat ér el, jelenleg elmarad a DeepSeek-R1 mögött a kritikus matematikai és kódolási benchmarkok (például AIME'25 és MATH-500) tekintetében. A Mistral közzétett egy tanulmányt az ilyen modellek tanításának összetettségéről, és bemutatta a Magistral Small-t is, amely a nagyobb Magistral Medium modellből készült lepárlással (distillation).
- A Mistral első lépése a megerősítéses tanuláson alapuló érvelési rendszerek felé
- 38 ezer válogatott matematikai és 35 ezer kódolási feladaton tanítva
- A Mistral Medium 64,9 pontot ért el az AIME'25 teszten, szemben a DeepSeek R1 70 pontjával
- A modell a tanítás során váratlanul fejlett multimodális érvelési képességeket fejlesztett ki
- A kiadás tartalmazza a kutatási dokumentációt és a lepárolt Small verziót is
Miért fontos?
A Mistral egy elismert, közepes méretű AI vállalat, amely hozzáfér a legmodernebb chipekhez. Ezért meglepő látni, hogy a 2025 júniusában kiadott érvelési modellje elmarad a DeepSeek januári R1 modelljének teljesítményétől, ami rávilágít arra, milyen rendkívül nehéz az élvonalban maradni. ---