Elon Musk és az xAI bemutatta a Grok-3-at mint „a Föld legokosabb AI-ját”
Elon Musk és mesterséges intelligencia vállalata, az xAI hivatalosan is bemutatta legújabb modelljét, a Grok-3-at, amelyet a Föld legokosabb AI-jaként harangoztak be. Az új generációs rendszer a fejlesztők szerint a legkorszerűbb, úgynevezett SoTA teljesítményt nyújtja a matematika, a tudományok és a kódolási feladatok terén. A legfontosabb teljesítményteszteken (benchmarks) ráadásul sikerült felülmúlnia a legfőbb riválisok legújabb megoldásait is, beleértve a Gemini-2 Pro-t, a Claude 3.5 Sonnet-et és a GPT-4o-t.
A fejlesztés részleteiből kiderül, hogy a fő Grok-3 modellt fokozatosan vezetik be a felhasználóknak a Grok alkalmazáson keresztül, míg a kisebb, de lényegesen gyorsabb válaszokat biztosító Grok-3 mini verzió is hamarosan szélesebb körben elérhetővé válik. Mindkét modell azonnal az élre került az olyan rangos teszteken, mint az AIME‘24, a GPQA és a LiveCodeBench, ráadásul a Grok-3 egyik korai verziója már korábban megszerezte az első helyet a Chatbot Arena rangsorában. Különösen izgalmas, hogy a modellekből logikai (reasoner) változatok is készültek, amelyek az OpenAI o3-mini-jéhez és a DeepSeek R1-hez hasonlóan képesek mélyebben átgondolni a komplex problémákat, miközben a mélyreható kutatást (deep research) is teljeskörűen támogatják.
Mögöttes technológiai szempontból az xAI nem kímélte az erőforrásokat, ugyanis a modelleket tízszer több számítási kapacitással tanították, mint a korábbi Grok-2-t. Ehhez a startup az xAI saját Colossus szuperszámítógépét használta, amely elképesztő mennyiségű, összesen 200 000 darab H100 GPU-val van felszerelve. Ez a monumentális infrastruktúra és a kapott eredmények egyúttal azt is kiválóan bizonyítják a szakma számára, hogy a technológiai skálázási törvények továbbra is érvényesek, azaz a nyers számítási kapacitás növelése még mindig hatékony fejlődést eredményez.
Ez a bejelentés rendkívül fontos mérföldkő, hiszen a mindössze kétéves xAI-t egy csapásra az AI-verseny abszolút élére pozicionálja. Ugyanakkor kérdéses, hogy meddig tart ez a piacvezető szerep, hiszen az OpenAI már gőzerővel készíti elő a GPT-4.5, majd ezt követően egy egységesített GPT-5 bevezetését. A piac többi szereplője, így az Anthropic, a DeepMind, valamint az olyan kínai óriások, mint az Alibaba és a DeepSeek szintén hatalmas lépésekkel haladnak előre ezen a területen, így a dominanciáért folyó harc élesebb, mint valaha.
- A fő Grok-3 modellt fokozatosan vezetik be a Grok alkalmazáson keresztül, a kisebb Grok-3 mini verzió pedig gyorsabb válaszokat ígér.
- Mindkét modell az élre került az AIME‘24, a GPQA és a LiveCodeBench teljesítményteszteken, a Grok-3 egyik korai verziója pedig az 1. helyet szerezte meg a Chatbot Arena rangsorában.
- A modelleknek léteznek logikai (reasoner) változatai is, amelyek „átgondolják” a problémákat, az OpenAI o3-mini-jéhez és a DeepSeek R1-hez hasonlóan. Emellett támogatják a mélyreható kutatást (deep research) is.
- A modelleket tízszer több számítási kapacitással tanították, mint a Grok-2-t, az xAI 200 000 darab H100 GPU-val felszerelt Colossus szuperszámítógépét használva (ezzel bizonyítva, hogy a skálázási törvények továbbra is érvényesek).
A Grok-3 az alig kétéves xAI-t az AI-verseny élére pozicionálja. Érdekes lesz azonban látni, hogy meddig tart ez a piacvezető szerep, mivel az OpenAI a GPT-4.5, majd egy egységesített GPT-5 bevezetésére készül. Az Anthropic, a DeepMind, valamint az olyan kínai szereplők, mint az Alibaba és a DeepSeek szintén hatalmas lépésekkel haladnak ezen a területen. ---