AI ÉS TECHNOLÓGIAI HÍREK
Az Alibaba új Qwen2-VL modellje képes 20 perces videók elemzésére
A kínai e-kereskedelmi óriás, az Alibaba kiadott egy új vizuális-nyelvi modellt Qwen2-VL néven. Ezt a modellt kifejezetten hosszú formátumú videótartalmak kezelésére tervezték; képes több mint 20 perces videók elemzésére és megértésére, ami jelentős előrelépés sok meglévő multimodális modellhez képest.
- A Qwen2-VL képes a 20 percet meghaladó videótartalmak feldolgozására és elemzésére
- A modell az Alibaba folyamatosan bővülő, open-source Qwen modellcsaládjának része
- Fontos lépés az AI azon képességében, hogy hosszú vizuális szekvenciák során is fenntartsa a kontextust
- A technológia jelentős hatással lehet az automatizált videócímkézésre és a komplex tartalomelemzésre
Miért fontos?
A látásalapú modellek időbeli ablakának növelése lehetővé teszi az AI számára, hogy összetettebb feladatokat lásson el a biztonságtechnika, a szórakoztatás és a megfigyelés területén, ahol hosszú időtartamú események megértése szükséges. ---