A DeepSeek R1 érvelő modell felveszi a versenyt az OpenAI o1-gyel nyílt forráskódú kiadásként
A DeepSeek AI új érvelő modellje, a DeepSeek R1, a benchmark teszteken eléri az OpenAI o1 szintjét, és open-source formában jelent meg. A kutatási dokumentációjuk számos titkot felfed az érvelő modellek mögött. További érdekesség: ezt az R1 modellt használják más kis open-source modellek (a Qwen és a Llama családból) fejlesztésére is. Ez végre életképessé teheti a lokális AI modelleket.
- A legfontosabb érvelési benchmarkokon felveszi a versenyt az OpenAI o1 modelljével.
- A modell és a kutatási dokumentáció is open-source.
- Érvelési lepárlást (distillation) használ kisebb modellek, például a Qwen és a Llama javítására.
- Növeli a fejlett AI lokális futtatásának lehetőségét lakossági hardvereken.
Miért fontos?
Egy olyan modell nyílttá tétele, amely versenyre kél az olyan zárt modellekkel, mint az o1, felgyorsítja a kutatást, és lehetővé teszi a fejlesztők számára, hogy nagy intelligenciájú érvelő modelleket futtassanak anélkül, hogy drága, saját tulajdonú API-kra támaszkodnának. ---
Kapcsolódó hírek
A Google frissíti a Geminit a Deep Research funkcióval és keresési előzmények alapú személyre szabással
2025. március 18.
Az OpenAI engedélyezi a Code Interpretert az o1 és o3-mini modellekhez
2025. március 18.
Levelsio bejelentette a hétnapos Vibe Coding Game Jam hackathont
2025. március 18.