FEJLESZTÉSI HÍREK
Az Allen AI bemutatta az OLMo 3.1-et és a byte-szintű Bolmo érvelési modellt
Az Allen AI két jelentős open-source modellt adott ki az iparági megjelenési hullám részeként. Az OLMo 3.1-et jelenleg a legerősebb teljesen nyílt érvelési modellnek tekintik a megerősítéses tanulási (reinforcement learning) folyamatok kiterjesztése után, ami hatalmas fejlődést mutat az utasításkövetés terén. Emellett a labor bemutatta a Bolmo-t is, amely byte-szintű tokenizációt használ. A hagyományos szórész-tokenek helyett nyers bájtokat feldolgozva a Bolmo hatékonyabban kezeli az összetett kódokat, a matematikai jelöléseket és a többnyelvű szövegeket.
- Az OLMo 3.1 20 pontot javult az utasításkövetési benchmarkokon.
- A kiadás tartalmazza a speciális Think 32B és Instruct 32B verziókat is.
- A Bolmo 7B és 1B méretekben érhető el, helyi futtatásra optimalizálva.
- Az Arcee AI a DistillKit eszközzel járult hozzá a hullámhoz a modell-tömörítés érdekében.
Miért fontos?
Az open-source AI környezet átalakult, jelenleg a kínai laborok határozzák meg a technológiai élvonalat. Az NVIDIA és az Allen AI kiadásai egy stratégiai amerikai választ jelentenek, amely a hatékonyságra, az érvelésre és a radikális nyitottságra összpontosít.