APPLE
Az Apple kiadta a DCLM-7B open-source AI modelljét és a teljes adatkészletet
Az Apple nemrég mutatta be új, 7 milliárd paraméteres open-source AI modelljét DCLM-7B néven, amely felülmúlja a Mistral 7B-t, és a legfontosabb teljesítménymutatók alapján megközelíti az olyan vezető nyílt modelleket, mint a Llama 3 és a Gemma.
- A DCLM-7B modell 63,7%-os 5-shot pontosságot ér el az MMLU teszten, amivel megelőzi a Mistral 7B-t.
- Az Apple nemcsak a modell súlyait és az oktatókódot tette open-source-szá, hanem a teljes előoktatási adatkészletet is.
- A modellt 2,5 billió tokenen oktatták az OpenLM keretrendszeren alapuló előoktatási receptek használatával.
- A modellcsalád elérhető a Hugging Face platformon a kutatók és fejlesztők számára.
Miért fontos?
Bár az Apple kissé késve szállt fel az open-source hájp-vonatra, a fejlesztők világszerte értékelni fogják a váratlanul megnyitott adatkészletet. Ez azt jelenti, hogy a kutatók és fejlesztők mostantól nemcsak a modellhez férhetnek hozzá nyíltan, hanem a létrehozása mögötti teljes folyamathoz is. ---