AI MODELLEK
Az Alibaba kiadta a Qwen3 nyílt súlyú modelljeit hibrid következtetési képességekkel
A Qwen új 30B MoE modellje a korai Claude 3.5 Sonnet-hez hasonló élményt nyújt. Tegnap jelent meg a Qwen3 nyílt súlyú modellcsaládja a szokásos Qwen csomaggal, 0,6B és 32B paraméter közötti méretekben. Elérhető egy 235B MoE modell is hibrid következtetéssel, de ez hajlamos a "túlgondolásra", és nem olyan jó, mint a DeepSeek R1.
- Teljes nyílt súlyú modellcsalád 0,6B és 32B paraméter közötti tartományban
- A 30B MoE modell teljesítménye a korai Claude 3.5 Sonnet-hez mérhető
- Bemutatkozott egy 235B MoE modell hibrid következtetési funkciókkal
- A megfigyelések szerint a legnagyobb modell "túlgondolási" problémákkal küzdhet a DeepSeek R1-hez képest
Miért fontos?
A nagy teljesítményű nyílt súlyú modellek, mint a Qwen3 folyamatos megjelenése, hatékony alternatívát kínál a fejlesztői közösségnek a zárt forráskódú vállalati modellekkel szemben. ---