A Grok-2 javítja a sebességet, a pontosságot és az átláthatóságot
Az xAI alig néhány nappal a béta verzió elindítása után máris jelentős frissítéseket vezetett be a Grok-2 és a Grok-2 mini mesterséges intelligencia modelljeinél. A fejlesztések elsősorban a sebességet, a pontosságot és az átláthatóságot érintik, amelyek révén a startup komoly kihívójává vált a piacvezető technológiai óriásoknak. A Grok-2 mini verziója a legújabb optimalizációknak köszönhetően megduplázta a sebességét, miközben mindkét modell precízebb válaszadásra képes. A frissítések hatására a modellek látványos sikereket értek el a független teljesítményméréseken is, megszilárdítva helyüket a világ élvonalbeli LLM megoldásai között.
A technikai háttérre rávilágítva, a Grok-2 mini rendkívüli sebésségnövekedése mögött az áll, hogy a fejlesztők az SGLang használatával teljesen újraírták a következtetési, vagyis az inference készletet. Ez a strukturális átalakítás tette lehetővé, hogy a kisebb verzió mostantól kétszer olyan gyorsan fusson, mint a korábbi változat. A sebesség mellett a pontosság terén is komoly előrelépés történt: egy xAI alkalmazott beszámolója szerint a csökkentett kvantálási hiba (quantization error) révén mind a Grok-2, mind a mini variáns valamivel pontosabbá vált. A pontosság mellett az átláthatóság is növekedett, mivel mindkét modell felkerült a széles körben elismert LMSYS Chatbot Arena nyilvános ranglistájára. Itt a nagyobb Grok-2 modell közvetlenül a bemutatkozása után az előkelő második helyet szerezte meg, amivel sikerült megelőznie az Anthropic által fejlesztett Claude 3.5 Sonnetet.
A mérési adatok részletesebb elemzése azt mutatja, hogy a Grok-2 különösen a matematikai feladatok megoldásában jeleskedik, ahol jelenleg az abszolút első helyen áll a rangsorban. Emellett csúcsteljesítményt nyújt a kifejezetten nehéz promptok kezelése, a kódolás, valamint az összetett utasításkövetés terén is. Mindez azért bír rendkívüli jelentőséggel, mert az xAI alig 18 hónappal az alapítása után volt képes kifejleszteni a világ harmadik legjobb LLM modelljét, ami valósággal lenyűgözte a teljes AI közösséget. Ez a hihetetlenül gyors fejlődési tempó nemcsak arra bizonyíték, hogy a Grok-2 az AI-verseny egyik legfőbb esélyesévé lépett elő, hanem arra is, hogy a fokozódó piaci verseny az egész iparágban drasztikusan felgyorsíthatja a fejlesztéseket a jövőben.
- A Grok-2 mini mostantól kétszer olyan gyors, mint korábban, köszönhetően az SGLang használatával újraírt következtetési (inference) készletnek.
- Egy xAI alkalmazott szerint mind a Grok-2, mind a mini verziója valamivel pontosabbá vált a csökkentett kvantálási hiba miatt.
- Emellett a nagyobb átláthatóság érdekében mindkét Grok-2 modell felkerült az LMSYS Chatbot Arena ranglistájára; a Grok-2 nagyobb modellje a 2. helyen áll, megelőzve a Claude 3.5 Sonnetet.
- A Grok-2 különösen a matematikában jeleskedik, ahol az 1. helyen áll, és csúcsteljesítményt nyújt a nehéz promptok, a kódolás és az utasításkövetés terén.
Alig 18 hónappal az alapítás után a világ harmadik legjobb LLM modelljének megalkotása lenyűgözte a teljes AI közösséget. Ez nemcsak a Grok-2-t teszi az AI-verseny egyik fő esélyesévé, hanem fokozza a versenyt is, ami felgyorsíthatja a fejlesztéseket az egész iparágban. ---