Az Adept kiadta a Fuyu-8B-t, egy kompakt multimodális modellt digitális ágensekhez

2023. november 2. · MI Történik? · 1 perc olvasás

Az Adept bemutatta a Fuyu-8B-t, amelyet a világ legkisebb és leghatékonyabb, kifejezetten digitális ágensekhez tervezett multimodális modelljeként jellemeznek. A hagyományos, komplex látáskódolókra támaszkodó multimodális modellekkel ellentétben a Fuyu-8B egy egyszerűsített, decoder-only transformer architektúrát használ. Ez a kialakítás lehetővé teszi, hogy a képrészleteket (image patches) szöveges tokenként kezelje, így a modell tetszőleges képfelbontást képes feldolgozni, és jelentősen kisebb késleltetéssel végez vizuális érvelést, mint nagyobb versenytársai.

8 milliárd paraméteres, decoder-only transformer architektúrával rendelkezik
Közvetlenül dolgozza fel a képrészleteket, külön látáskódoló (vision encoder) nélkül
Nagy felbontású vizuális érvelésre, UI-navigációra és dokumentumértelmezésre optimalizálták
Megengedő licenc alatt jelent meg, kutatási és kereskedelmi célokra egyaránt felhasználható

Miért fontos?

A Fuyu-8B bizonyítja, hogy a nagy teljesítményű vizuális érvelés kisebb, gyorsabb modellekben is lehetséges, ami kulcsfontosságú a valós idejű AI ágensek és az eszközön futó alkalmazások fejlesztéséhez. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Epicure: Egy többnyelvű AI összetevő-beágyazó modell receptanalízishez

2026. május 28.

Claude Mythos: Az Anthropic állítólag rendkívül erős, még meg nem jelent AI modellje

2026. április 15.

Az Anthropic egy védetlen adatbázison keresztül szivárogtatta ki a nagy teljesítményű Claude Mythos modellt

2026. március 30.

Tudj meg többet

AI a mindennapi életben: A digitális önellátás alapjai