Az Alibaba kiadta a Qwen3 nyílt súlyú modelljeit hibrid következtetési képességekkel

2025. április 29. · MI Történik? · 1 perc olvasás

A Qwen új 30B MoE modellje a korai Claude 3.5 Sonnet-hez hasonló élményt nyújt. Tegnap jelent meg a Qwen3 nyílt súlyú modellcsaládja a szokásos Qwen csomaggal, 0,6B és 32B paraméter közötti méretekben. Elérhető egy 235B MoE modell is hibrid következtetéssel, de ez hajlamos a "túlgondolásra", és nem olyan jó, mint a DeepSeek R1.

Teljes nyílt súlyú modellcsalád 0,6B és 32B paraméter közötti tartományban
A 30B MoE modell teljesítménye a korai Claude 3.5 Sonnet-hez mérhető
Bemutatkozott egy 235B MoE modell hibrid következtetési funkciókkal
A megfigyelések szerint a legnagyobb modell "túlgondolási" problémákkal küzdhet a DeepSeek R1-hez képest

Miért fontos?

A nagy teljesítményű nyílt súlyú modellek, mint a Qwen3 folyamatos megjelenése, hatékony alternatívát kínál a fejlesztői közösségnek a zárt forráskódú vállalati modellekkel szemben. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Epicure: Egy többnyelvű AI összetevő-beágyazó modell receptanalízishez

2026. május 28.

Claude Mythos: Az Anthropic állítólag rendkívül erős, még meg nem jelent AI modellje

2026. április 15.

Az Anthropic egy védetlen adatbázison keresztül szivárogtatta ki a nagy teljesítményű Claude Mythos modellt

2026. március 30.

Tudj meg többet

AI modellek finomhangolása és egyedi fejlesztése: Lépj túl a generikus megoldásokon!