MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Alibaba kiadta a Qwen-VL-Max vision modellt, amely felveszi a versenyt a zárt forráskódú SOTA modellekkel

Januárban jelentős előrelépés történt a multimodális AI területén olyan modellek megjelenésével, amelyek képesek képek értelmezésére és dokumentumok olvasására. Az Alibaba nyílt forráskódúvá tette a Qwen-VL-Max modellt – egy nagy vizuális nyelvi modellt, amely felülmúlja az összes korábbi nyílt forráskódú modellt, és a Gemini Ultra-val, valamint a GPT-4V-vel egy szinten teljesít.
Eredeti forrás megtekintése (angol) →