TRENDEK ÉS HÍREK
A DeepSeek R1 érvelő modell felveszi a versenyt az OpenAI o1-gyel nyílt forráskódú kiadásként
A DeepSeek AI új érvelő modellje, a DeepSeek R1, a benchmark teszteken eléri az OpenAI o1 szintjét, és open-source formában jelent meg. A kutatási dokumentációjuk számos titkot felfed az érvelő modellek mögött. További érdekesség: ezt az R1 modellt használják más kis open-source modellek (a Qwen és a Llama családból) fejlesztésére is. Ez végre életképessé teheti a lokális AI modelleket.
- A legfontosabb érvelési benchmarkokon felveszi a versenyt az OpenAI o1 modelljével.
- A modell és a kutatási dokumentáció is open-source.
- Érvelési lepárlást (distillation) használ kisebb modellek, például a Qwen és a Llama javítására.
- Növeli a fejlett AI lokális futtatásának lehetőségét lakossági hardvereken.
Miért fontos?
Egy olyan modell nyílttá tétele, amely versenyre kél az olyan zárt modellekkel, mint az o1, felgyorsítja a kutatást, és lehetővé teszi a fejlesztők számára, hogy nagy intelligenciájú érvelő modelleket futtassanak anélkül, hogy drága, saját tulajdonú API-kra támaszkodnának. ---