A Google kiadta a Gemma nyílt modelleket, hogy versenybe szálljon a LLaMa-val és a Mistrallal

2024. február 26. · MI Történik? · 1 perc olvasás

A Google megalkotta és közzétette a Gemma-t, két nyíltan hozzáférhető, kisméretű és nagy teljesítményű AI modellt. A legfontosabb újdonság, hogy a Gemma modellek kiválóak, nagyon kicsik (így személyi számítógépeken vagy alacsony erőforrású szervereken is futtathatók), és nyíltan elérhetővé tették őket ahelyett, hogy korlátozott API-n keresztül szolgáltatnák őket.

Bár a Gemma modellek teljesítménye nem éri el a zárt forráskódú modellekét (mint a GPT-4, Claude 2, Gemini Pro stb.), a nyíltan hozzáférhető modellekhez képest rendkívül jól teljesítenek. A modelleket hatalmas adatmennyiségen tanították: a Gemma 2B-t 2 billió, a Gemma 7B-t pedig 6 billió tokenen.

A Gemma 7B modell 64,3 pontot ért el az MMLU teszten, szemben a LLaMa 2 45,3-as értékével
A Gemma 7B 46,4 pontot ért el a GSM8K teszten, míg a LLaMa 2 csak 14,6-ot
A Gemma 7B 32,3 pontot kapott a HumanEval-on, szemben a LLaMa 2 12,8-as pontszámával
A Gemma 2B modellt 2 billió tokenen tanították
A Gemma 7B modellt 6 billió tokenen tanították
Személyi számítógépeken vagy kisméretű szervereken való futtatásra tervezték

Miért fontos?

Képzeljünk el két óriást, akik a fejünk felett harcolnak egymással – és képzeljük el, hogy minden alkalommal, amikor egy ütés célba ér, az öklükből aranyérmék zápora hullik ránk és mindenki másra, aki a harcot nézi. Pontosan ilyen érzés manapság figyelni a technológiai óriáscégek AI-dominanciáért folytatott küzdelmét, mivel legtöbbjük úgy próbál előnyhöz jutni, hogy vagy a) egymás alá licitálnak az árazásban, vagy b) kommoditizálják a versenytársukat, és nyíltan hozzáférhető modellek kiadásával növelik az ügyfélszerzési tölcsér tetejét. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Epicure: Egy többnyelvű AI összetevő-beágyazó modell receptanalízishez

2026. május 28.

Claude Mythos: Az Anthropic állítólag rendkívül erős, még meg nem jelent AI modellje

2026. április 15.

Az Anthropic egy védetlen adatbázison keresztül szivárogtatta ki a nagy teljesítményű Claude Mythos modellt

2026. március 30.

Tudj meg többet

Neurális hálózat: mi az és hogyan tanul? Egyszerű magyarázat

Gépi tanulás: mi az és hogyan működik? Érthető magyarázat kezdőknek