MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Alibaba kiadta a Qwen3 nyílt súlyú modelljeit hibrid következtetési képességekkel

A Qwen új 30B MoE modellje a korai Claude 3.5 Sonnet-hez hasonló élményt nyújt. Tegnap jelent meg a Qwen3 nyílt súlyú modellcsaládja a szokásos Qwen csomaggal, 0,6B és 32B paraméter közötti méretekben. Elérhető egy 235B MoE modell is hibrid következtetéssel, de ez hajlamos a "túlgondolásra", és nem olyan jó, mint a DeepSeek R1.
Miért fontos?

A nagy teljesítményű nyílt súlyú modellek, mint a Qwen3 folyamatos megjelenése, hatékony alternatívát kínál a fejlesztői közösségnek a zárt forráskódú vállalati modellekkel szemben. ---

Eredeti forrás megtekintése (angol) →