A DeepSeek R1 érvelő modell felveszi a versenyt az OpenAI o1-gyel nyílt forráskódú kiadásként

2025. január 21. · MI Történik? · 1 perc olvasás

A DeepSeek AI új érvelő modellje, a DeepSeek R1, a benchmark teszteken eléri az OpenAI o1 szintjét, és open-source formában jelent meg. A kutatási dokumentációjuk számos titkot felfed az érvelő modellek mögött. További érdekesség: ezt az R1 modellt használják más kis open-source modellek (a Qwen és a Llama családból) fejlesztésére is. Ez végre életképessé teheti a lokális AI modelleket.

A legfontosabb érvelési benchmarkokon felveszi a versenyt az OpenAI o1 modelljével.
A modell és a kutatási dokumentáció is open-source.
Érvelési lepárlást (distillation) használ kisebb modellek, például a Qwen és a Llama javítására.
Növeli a fejlett AI lokális futtatásának lehetőségét lakossági hardvereken.

Miért fontos?

Egy olyan modell nyílttá tétele, amely versenyre kél az olyan zárt modellekkel, mint az o1, felgyorsítja a kutatást, és lehetővé teszi a fejlesztők számára, hogy nagy intelligenciájú érvelő modelleket futtassanak anélkül, hogy drága, saját tulajdonú API-kra támaszkodnának. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Google frissíti a Geminit a Deep Research funkcióval és keresési előzmények alapú személyre szabással

2025. március 18.

Az OpenAI engedélyezi a Code Interpretert az o1 és o3-mini modellekhez

2025. március 18.

Levelsio bejelentette a hétnapos Vibe Coding Game Jam hackathont

2025. március 18.

Tudj meg többet

OpenAI Sora: AI videógenerálás – minden, amit tudni kell

OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép