A Meta LLaMA alapmodellje beindítja az open-source AI közösséget

FEBRUARY

A Meta LLaMA alapmodellje beindítja az open-source AI közösséget

2024. január 13. · MI Történik? · 1 perc olvasás

A LLaMA egy nyílt, 65 milliárd paraméteres LLM, amelyet 1,4 billió tokenen tanítottak. A legtöbb benchmarkon felülmúlja a nagyobb, élvonalbeli LLM-eket, mint a GPT-3-at és a PaLM-540B-t, utat nyitva az olyan modelleknek, mint az Alpaca és a Vicuna, és lendületet adva az open-source LLM közösségnek.

65 milliárd paraméteres alapmodell
1,4 billió tokenen tanítva
Több benchmarkon is legyőzte a GPT-3-at és a PaLM-540B-t
Olyan jelentős finomhangolt modellek alapjául szolgált, mint az Alpaca és a Vicuna

Miért fontos?

A LLaMA megjelenése volt a modern open-source AI mozgalom katalizátora, olyan minőségi alapot biztosítva, amely lehetővé tette a kutatók számára, hogy zárt laboratóriumokon kívül is nagy teljesítményű modelleket fejlesszenek. ---

Eredeti forrás megtekintése (angol) →