DEEPSEEK
A DeepSeek kiadta a GPT-5 és a Gemini 3 Pro szintjét hozó V3.2-es érvelő modelljeit
A kínai DeepSeek startup épp most adta ki a V3.2 és V3.2-Speciale modelleket. Ez a két érvelő modell a legmodernebb (SOTA) modellekkel, például a GPT-5-tel és a Gemini 3 Pro-val azonos szinten teljesít – miközben csökkenti a költségeket és open-source licenc alatt bárki számára elérhető marad.
- A V3.2 eléri vagy megközelíti a GPT-5, a Claude 4.5 Sonnet és a Gemini 3 Pro szintjét a matematikai, eszközhasználati és kódolási teszteken, míg a robusztusabb Speciale változat több területen le is körözi őket.
- A Speciale variáns aranyérmes pontszámokat ért el a 2025-ös Nemzetközi Matematikai Diákolimpián és Informatikai Diákolimpián, utóbbin (IOI) összesítettben a 10. helyen végzett.
- A V3.2 árazása 0,28 dollár bemeneti / 0,42 dollár kimeneti költség 1 millió tokenenként, ami töredéke a Gemini 3 Pro (2$ / 12$), a GPT-5.1 (1,25$ / 10$) és a Sonnet 4.5 (3$ / 15$) árainak.
- Mindkét 685 milliárd paraméteres modell MIT licenc alatt jelent meg, a súlyok pedig bárki számára letölthetők a Hugging Face felületéről.
Miért fontos?
A DeepSeek R1 megjelenése megrázta a piacokat és vitát indított az amerikai chip-exportkorlátozásokról; a V3.2 folytatása pedig azt bizonyítja, hogy a kínai labor nem csak egy egyszeri sikert ért el. Egy csúcsteljesítményű modellt tettek open-source-szá jelentős árcsökkentés mellett. A prémium API-díjakat felszámító amerikai laborokra mostantól sokkal nagyobb nyomás nehezedik, hogy igazolják ezt az árkülönbséget. ---