ALIBABA
Az Alibaba kiadta a QwQ-32B érvelő modellt, amely kihívást jelent a DeepSeek-R1 hatékonyságának
Az Alibaba Qwen csapata kiadta a QwQ-32B-t, egy új AI érvelő modellt, amely reinforcement learning-et alkalmaz, hogy a költségek töredékéért érje el vagy haladja meg a nagyobb versenytársak, például a DeepSeek-R1 teljesítményét.
- A QwQ-32B nagy léptékű reinforcement learning-et használ, ami jelentősen növeli a teljesítményt a haladó matematikai, kódolási és érvelésalapú feladatokban.
- A modell nagyjából 20-szor kisebb, mint a DeepSeek-R1, mégis hasonló vagy kiválóbb teljesítményt nyújt a legfontosabb benchmarkok során.
- Az ára mindössze 0,20 dollár egymillió input és output tokenenként, ami nagyjából 90%-os csökkenést jelent a hasonló teljesítményű modellekhez, például az R1-hez és az o1-minihez képest.
- A Qwen open-source-ként tette közzé a modellt az Apache 2.0 licenc alatt, amely elérhető a Hugging Face-en és az Alibaba Cloud ModelScope platformján.
Miért fontos?
Miért fontos: Kína open-source modelljei tovább gyorsulnak – a Qwen legújabb bevezetése jelentős teljesítménynövekedést mutat a csökkenő méret (a közel frontier-szintű intelligencia már az eszközökön is jelen van) és költségek ellenére. Az okos oktatási megközelítések továbbra is bizonyítják értéküket a puszta modellmérettel szemben, ahogy a laborok továbbra is az AGI felé törekszenek.