AI MODELLEK
Az Adept kiadta a Fuyu-8B-t, egy kompakt multimodális modellt digitális ágensekhez
Az Adept bemutatta a Fuyu-8B-t, amelyet a világ legkisebb és leghatékonyabb, kifejezetten digitális ágensekhez tervezett multimodális modelljeként jellemeznek. A hagyományos, komplex látáskódolókra támaszkodó multimodális modellekkel ellentétben a Fuyu-8B egy egyszerűsített, decoder-only transformer architektúrát használ. Ez a kialakítás lehetővé teszi, hogy a képrészleteket (image patches) szöveges tokenként kezelje, így a modell tetszőleges képfelbontást képes feldolgozni, és jelentősen kisebb késleltetéssel végez vizuális érvelést, mint nagyobb versenytársai.
- 8 milliárd paraméteres, decoder-only transformer architektúrával rendelkezik
- Közvetlenül dolgozza fel a képrészleteket, külön látáskódoló (vision encoder) nélkül
- Nagy felbontású vizuális érvelésre, UI-navigációra és dokumentumértelmezésre optimalizálták
- Megengedő licenc alatt jelent meg, kutatási és kereskedelmi célokra egyaránt felhasználható
Miért fontos?
A Fuyu-8B bizonyítja, hogy a nagy teljesítményű vizuális érvelés kisebb, gyorsabb modellekben is lehetséges, ami kulcsfontosságú a valós idejű AI ágensek és az eszközön futó alkalmazások fejlesztéséhez. ---