MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Alibaba új Qwen2-VL modellje képes 20 perces videók elemzésére

A kínai e-kereskedelmi óriás, az Alibaba kiadott egy új vizuális-nyelvi modellt Qwen2-VL néven. Ezt a modellt kifejezetten hosszú formátumú videótartalmak kezelésére tervezték; képes több mint 20 perces videók elemzésére és megértésére, ami jelentős előrelépés sok meglévő multimodális modellhez képest.
Miért fontos?

A látásalapú modellek időbeli ablakának növelése lehetővé teszi az AI számára, hogy összetettebb feladatokat lásson el a biztonságtechnika, a szórakoztatás és a megfigyelés területén, ahol hosszú időtartamú események megértése szükséges. ---

Eredeti forrás megtekintése (angol) →