MINIMAX
A MiniMax kiadta az M1 nyílt forráskódú reasoning modellt 1 millió tokenes kontextussal
A kínai MiniMax AI startup kiadta az M1-et, egy nyílt forráskódú reasoning modellt hatalmas, 1 millió tokenes kontextusablakkal, amely a vezető nyílt modellekhez hasonló teljesítményt nyújt a tanítási költségek töredékéért.
- A MiniMax állítása szerint az M1 rendelkezik a „világ legnagyobb kontextusablakával”, amely 1 millió bemeneti tokent kezel, miközben 80 ezer tokenes „gondolkodási büdzsét” támogat a kimenetekhez.
- Bár minden téren versenyképes, az M1 kiemelkedik a szoftverfejlesztésben és az ágens alapú eszközhasználatban, emellett masszívan túlteljesít a hosszú kontextusú benchmark teszteken.
- A vállalat bemutatta a CISPO-t is, egy új megerősítéses tanulási (reinforcement learning) algoritmust, amely kétszer gyorsabb tanítást tett lehetővé a meglévő módszerekhez képest.
- A startup közölte, hogy a CISPO segítségével a modell teljes tanítási folyamata mindössze 535 ezer dollárba került és csak három hétig tartott, ami drámaian alulmúlja a rivális rendszerek költségvetését.
Miért fontos?
A kínai laborok továbbra is új, nyílt forráskódú erőművekkel törnek előre, az M1 pedig feszegeti a kontextus-kapacitás határait. A MiniMax tanítási hatékonysága azt is mutatja, hogy az innovatív AI-architektúrák továbbra is cáfolják azokat a feltételezéseket, miszerint a költség a legfőbb tényező az intelligencia skálázásában. ---