NAGY NYELVI MODELLEK (LLM-EK)
A Z.ai GLM-5 modellje érte el a legmagasabb pontszámot az Open-Weights Intelligence indexen
A Z.ai több mint megduplázta zászlóshajó nagy nyelvi modelljének méretét, hogy kiemelkedő teljesítményt nyújtson a nyílt súlyozású (open-weights) versenytársak között. A GLM-5-öt hosszú ideig futó ágensi feladatokra tervezték. Az Artificial Analysis Intelligence indexén megelőzi a többi nyílt súlyozású modellt.
A Z.ai kevés részletet árult el a GLM-5 architektúrájáról és tanításáról. A vállalat 28,5 billió tokenen tanította elő a GLM-5-öt, szemben a GLM-4,5-höz használt 23 billió tokennel. A GLM-5 bizonyos kódolási és ágensi feladatokban a legmagasabb teljesítményt érte el a nyílt súlyozású modellek között, de általában elmaradt a védett, úttörő (frontier) modellek mögött.
- Bemenet/Kimenet: Szöveg be (akár 200 000 token), szöveg ki (akár 128 000 token).
- Architektúra: Mixture-of-experts transformer, 744 milliárd paraméter, tokenenként 40 milliárd aktív paraméter.
- Funkciók: Függvényhívás, érvelés és kontextus-gyorsítótárazás (context caching).
- Utótanítás: A „slime” nevű nyílt forráskódú megerősítéses tanulási szoftvert alkalmazták, ahol az adatgenerálás és a tanítás független folyamatok.
- Attention mechanizmus: DeepSeek sparse attention-t használ a számítási igény csökkentésére hosszú kontextusok esetén.
- Benchmark teljesítmény: 50 pontot ért el az Artificial Analysis Intelligence indexén, megelőzve a Kimi K2.5-öt (47).
- Ágensi teljesítmény: 98 százalékot ért el a 𝜏²-Bench Telecom teszten, és felülmúlta a nyílt súlyozású modelleket a Vending-Bench 2-n.
- Kódolás: Első helyen végzett a nyílt súlyozású modellek között a Chatbot Code Arena-ban 1449 Elo ponttal.
- Elérhetőség: A súlyok elérhetőek a Hugging Face-en MIT licenc alatt; az API különböző díjszabásokkal vehető igénybe.
Miért fontos?
Az Artificial Analysis Intelligence indexén a GLM-5 majdnem eléri a védett piacvezetők, a Claude Opus 4.6 és a GPT-5.2 szintjét. A nyílt súlyozású és a védett modellek közötti csökkenő különbség nagy teljesítményű opciókat kínál a fejlesztőknek, amelyeket módosíthatnak és/vagy saját hardverükön futtathatnak.