NAGY NYELVI MODELLEK
A Meta Llama 3.1 vezeti az open-source AI áttörések hónapját
Júliust az open-source AI jelentős fellendülése jellemezte: a Meta Llama 3.1 sorozata és a Google Gemma-2-2B modellje kitolták a szabadon elérhető modellek határait. Ezek a kiadások elérték azt a szintet, ahol már a legjobb zárt forráskódú LLM szolgáltatókkal, például a GPT-4o-val és a Claude Sonnet-tel is felveszik a versenyt, jelezve a mesterséges intelligencia versenyhelyzetének átalakulását.
- A Meta bemutatta a Llama 3.1-et, egy nyílt csomagot, amely 7B, 80B és 405B paraméteres modelleket tartalmaz.
- A 405B modell az első open-source modell, amely több benchmark teszten is felülmúlja a GPT-4o-t és a Claude Sonnet-et.
- A Google kiadta a Gemma-2-2B-t, egy kompakt modellt, amely túlszárnyalja a nálánál 20-szor nagyobb modelleket, beleértve a Mixtral 8x7B-t is.
- Ezek a fejlemények a szabadon elérhető AI modellek növekvő erejét bizonyítják a zárt rendszerekkel szemben.
Miért fontos?
Július az open-source AI hónapja volt, amely során a nagy szereplők feszegették a szabadon elérhető modellek határait, valódi alternatívát állítva a vezető fizetős LLM szolgáltatóknak, mint a GPT-4o és a Claude Sonnet. ---