KIEMELT HÍREK
Az Alibaba Cloud kiadta a Qwen2-VL nyílt látás-nyelvi modellcsaládot
Az Alibaba Cloud nyilvánosan közzétette a Qwen2-VL-t – egy kereskedelmileg is használható nyílt látás-nyelvi (vision-language) modellcsaládot (72B, 2B), amely kiemelkedő vizuális megértéssel rendelkezik, és teljesítményben felülmúlja vagy megközelíti a főbb versenytársakat, beleértve a GPT-4o-t.
- Nyíltan közzétett látás-nyelvi modellcsalád 72B és 2B paraméterméretben
- Kereskedelmileg megengedő licenccel rendelkezik
- Kiválóan teljesít a vizuális megértési feladatokban
- Felülmúlja vagy megközelíti a főbb versenytársak, köztük a GPT-4o teljesítményét
Miért fontos?
A Qwen2-VL megjelenése jelentős előrelépés, mivel egy bivalyerős, kereskedelmileg is használható nyílt forráskódú alternatívát kínál a legfejlettebb zárt multimodális AI modellekkel szemben.