COHERE AZ AI-ÉRT
A Cohere kiadta az Aya Vision multimodális modellt 23 nyelv támogatásával
A Cohere nonprofit kutatóága, a Cohere For AI bemutatta az Aya Vision-t, egy nyílt multimodális AI-t, amely látás-nyelvi (vision-language) képességeket hoz 23 nyelven, lefedve a világ lakosságának több mint felét – ezzel új teljesítménybeli mércéket állítva fel.
- Az Aya Vision két méretben érkezik: a 8B verzió felülmúlja a nála tízszer nagyobb riválisokat, a 32B pedig a több mint kétszer akkora modelleket is veri, mint például a Llama-3.2 90B Vision.
- A modell képes képek értelmezésére és leírására, vizuális kérdések megválaszolására, valamint vizuális tartalmak fordítására különböző nyelveken – a vietnámitól az arabig.
- A modell CC nem-kereskedelmi licenc alatt jelent meg, és elérhető a Kaggle-en, a Hugging Face-en vagy a WhatsApp-on keresztül.
- A Cohere nyílt forráskódúvá tette az Aya Vision Benchmarkot is, amely a VLM-eket értékeli valós, többnyelvű szituációkhoz kapcsolódó, nyitott végű kérdések alapján.
Miért fontos?
Korábban már írtunk a nyelvi korlátokat lebontó AI modellekről, és most az Aya Vision-höz hasonló áttörések ugyanezt teszik a vizuális tartalmakkal. A fejlett AI használata nem korlátozódik csupán az angol nyelvű közönségre; a felhasználók világszerte hamarosan hozzáférhetnek egy hatékony, univerzális vizuális fordítóhoz. ---