MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Mistral kiadta a Magistral érvelő modellt, de elmarad a DeepSeek R1 mögött

A Mistral betanította első érvelő modelljét, a Magistral-t. A modell pontszámai megközelítik a DeepSeek „R1” modelljét, de a matematika és a kódolás fontos területein nem sikerül felülmúlnia azt. A Mistral javára írandó, hogy a kutatási tanulmány alapos elemzést nyújt az érvelés-alapú modellek tanításának összetettségéről, és a tanulmány mellett kiadták a Magistral Small-t is, egy kisméretű modellt, amelyet a közepes méretű Magistral Medium lepárlásával (distillation) tanítottak. A Magistral a Mistral Medium 3 modellre épülve készült. A matematika és kódolási teljesítmény javítása érdekében a Mistral egy 38 000 úgynevezett „aranyközépút” (goldilocks) matematikai problémából („sem túl könnyű, sem túl nehéz a modell számára”), valamint 35 000 kódolási problémából álló adatkészletet állított össze. A Mistral egy „ingyen ebéd” felfedezést is tett: „azt tapasztaltuk, hogy a modellek nemcsak megtartják multimodális képességeiket, hanem váratlanul fejlettebb multimodális érvelési képességeket fejlesztenek ki.”

Miért fontos?

A Mistral egy elismert, középméretű AI vállalat, amely hozzáfér a legmodernebb chipekhez, mégis a 2025 júniusában kiadott érvelő modellje elmarad a DeepSeek januári R1 modellje mögött. Ez rávilágít az AI élvonalában maradásért folytatott intenzív küzdelemre és annak nehézségeire. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Epicure: Egy többnyelvű AI összetevő-beágyazó modell receptanalízishez
2026. május 28.
Claude Mythos: Az Anthropic állítólag rendkívül erős, még meg nem jelent AI modellje
2026. április 15.
Az Anthropic egy védetlen adatbázison keresztül szivárogtatta ki a nagy teljesítményű Claude Mythos modellt
2026. március 30.
Tudj meg többet
OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép
DeepSeek vs. ChatGPT vs. Claude: Melyik AI gondolkodik a legjobban?