MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Google bemutatta a Gemini 3 Pro-t rekorddöntő látási képességekkel

Hivatalosan is elrajtolt a Gemini 3 Pro, amely a beszámolók szerint az iparági tesztek többségében legyőzi a GPT-5.1-et és a Claude 3.5 Sonnet-et, az SWE-Bench Verified teszt kivételével. Bár a modellt az általános érvelés terén csak kismértékben nevezik okosabbnak elődeinél, a legjelentősebb előrelépés a vizuális feldolgozásban történt. A képernyőfotók értelmezését vizsgáló benchmark teszten kiemelkedő, 72,7%-os eredményt ért el, míg a jelenlegi második legjobb modell csupán 36,2%-ot teljesít. Az új modell gyorsabb a Gemini 2.5 Pro-nál, bár a fejlesztők számára némileg magasabb áron érhető el. A bevezetés egybeesik egy új Google IDE megjelenésével is, amely Agent Managert és egy beépített böngészőt tartalmaz az ágensek által készített építmények megtekintéséhez és teszteléséhez.
Miért fontos?

A látási képességek terén elért hatalmas ugrás a megbízhatóbb multimodális ágensek felé történő elmozdulást sugallja, amelyek képesek eligazodni az összetett felhasználói felületeken – ez egy olyan feladat, amelyben a korábbi modellek gyakran kudarcot vallottak. ---

Eredeti forrás megtekintése (angol) →