FEBRUARY
A Meta LLaMA alapmodellje beindítja az open-source AI közösséget
A LLaMA egy nyílt, 65 milliárd paraméteres LLM, amelyet 1,4 billió tokenen tanítottak. A legtöbb benchmarkon felülmúlja a nagyobb, élvonalbeli LLM-eket, mint a GPT-3-at és a PaLM-540B-t, utat nyitva az olyan modelleknek, mint az Alpaca és a Vicuna, és lendületet adva az open-source LLM közösségnek.
- 65 milliárd paraméteres alapmodell
- 1,4 billió tokenen tanítva
- Több benchmarkon is legyőzte a GPT-3-at és a PaLM-540B-t
- Olyan jelentős finomhangolt modellek alapjául szolgált, mint az Alpaca és a Vicuna
Miért fontos?
A LLaMA megjelenése volt a modern open-source AI mozgalom katalizátora, olyan minőségi alapot biztosítva, amely lehetővé tette a kutatók számára, hogy zárt laboratóriumokon kívül is nagy teljesítményű modelleket fejlesszenek. ---