Alibaba

Az Alibaba kiadta a QwQ-32B érvelő modellt, amely kihívást jelent a DeepSeek-R1 hatékonyságának

2025. március 6. · MI Történik? · 1 perc olvasás

Az Alibaba Qwen csapata kiadta a QwQ-32B-t, egy új AI érvelő modellt, amely reinforcement learning-et alkalmaz, hogy a költségek töredékéért érje el vagy haladja meg a nagyobb versenytársak, például a DeepSeek-R1 teljesítményét.

A QwQ-32B nagy léptékű reinforcement learning-et használ, ami jelentősen növeli a teljesítményt a haladó matematikai, kódolási és érvelésalapú feladatokban.
A modell nagyjából 20-szor kisebb, mint a DeepSeek-R1, mégis hasonló vagy kiválóbb teljesítményt nyújt a legfontosabb benchmarkok során.
Az ára mindössze 0,20 dollár egymillió input és output tokenenként, ami nagyjából 90%-os csökkenést jelent a hasonló teljesítményű modellekhez, például az R1-hez és az o1-minihez képest.
A Qwen open-source-ként tette közzé a modellt az Apache 2.0 licenc alatt, amely elérhető a Hugging Face-en és az Alibaba Cloud ModelScope platformján.

Miért fontos?

Miért fontos: Kína open-source modelljei tovább gyorsulnak – a Qwen legújabb bevezetése jelentős teljesítménynövekedést mutat a csökkenő méret (a közel frontier-szintű intelligencia már az eszközökön is jelen van) és költségek ellenére. Az okos oktatási megközelítések továbbra is bizonyítják értéküket a puszta modellmérettel szemben, ahogy a laborok továbbra is az AGI felé törekszenek.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Qwen új open-source gondolkodó modellje

2026. május 24.

Az Alibaba kiadta a Wan2.1 open-source AI videógeneráló programcsomagot

2026. május 24.

Az Alibaba új Qwen3.5 Small AI modelljei túlszárnyalják a náluk 13-szor nagyobb rendszereket

2026. március 3.