ALIBABA
Az Alibaba bemutatta a QVQ-Max-ot a fejlett vizuális érveléshez és elemzéshez
Az Alibaba Qwen csapata kiadta a QVQ-Max-ot, egy új vizuális érvelési modellt, amely túlmutat az alapvető képfelismerésen, hogy képeken és videókon keresztül elemezze és értelmezze a vizuális információkat.
- A modell a QVQ-72B-Preview továbbfejlesztése, amely kiterjeszti a képességeket a matematikai problémamegoldás, a kódgenerálás és a kreatív feladatok területére.
- A QVQ-Max egy „gondolkodási” mechanizmussal rendelkezik, amelynek hossza a pontosság javítása érdekében állítható, és a gondolkodási idő növekedésével skálázható előnyöket mutat.
- További bemutatott komplex vizuális képességek közé tartozik a tervrajzok elemzése, a geometriai feladatok megoldása és a felhasználók által beküldött vázlatok véleményezése.
- A Qwen közölte, hogy a jövőbeli tervek között szerepel egy teljes körű vizuális ágens létrehozása, amely képes eszközök kezelésére és játékra.
Miért fontos?
Ez a Qwen harmadik modellbemutatója ezen a héten! Az Omni, a Qwen2.5-VL és most a QVQ-Max után a kínai nagyvállalat továbbra is ontja magából a kiváló modelleket az AI-spektrum minden területén. Mivel Kína elárasztja a piacot fejlett rendszerekkel, az USA és Kína közötti szakadék soha nem volt még ilyen kicsi. ---