AI MODELLEK
A Google kiadta a Gemma nyílt modelleket, hogy versenybe szálljon a LLaMa-val és a Mistrallal
A Google megalkotta és közzétette a Gemma-t, két nyíltan hozzáférhető, kisméretű és nagy teljesítményű AI modellt. A legfontosabb újdonság, hogy a Gemma modellek kiválóak, nagyon kicsik (így személyi számítógépeken vagy alacsony erőforrású szervereken is futtathatók), és nyíltan elérhetővé tették őket ahelyett, hogy korlátozott API-n keresztül szolgáltatnák őket.
Bár a Gemma modellek teljesítménye nem éri el a zárt forráskódú modellekét (mint a GPT-4, Claude 2, Gemini Pro stb.), a nyíltan hozzáférhető modellekhez képest rendkívül jól teljesítenek. A modelleket hatalmas adatmennyiségen tanították: a Gemma 2B-t 2 billió, a Gemma 7B-t pedig 6 billió tokenen.
- A Gemma 7B modell 64,3 pontot ért el az MMLU teszten, szemben a LLaMa 2 45,3-as értékével
- A Gemma 7B 46,4 pontot ért el a GSM8K teszten, míg a LLaMa 2 csak 14,6-ot
- A Gemma 7B 32,3 pontot kapott a HumanEval-on, szemben a LLaMa 2 12,8-as pontszámával
- A Gemma 2B modellt 2 billió tokenen tanították
- A Gemma 7B modellt 6 billió tokenen tanították
- Személyi számítógépeken vagy kisméretű szervereken való futtatásra tervezték
Miért fontos?
Képzeljünk el két óriást, akik a fejünk felett harcolnak egymással – és képzeljük el, hogy minden alkalommal, amikor egy ütés célba ér, az öklükből aranyérmék zápora hullik ránk és mindenki másra, aki a harcot nézi. Pontosan ilyen érzés manapság figyelni a technológiai óriáscégek AI-dominanciáért folytatott küzdelmét, mivel legtöbbjük úgy próbál előnyhöz jutni, hogy vagy a) egymás alá licitálnak az árazásban, vagy b) kommoditizálják a versenytársukat, és nyíltan hozzáférhető modellek kiadásával növelik az ügyfélszerzési tölcsér tetejét. ---