AI MODELLEK
A Google bemutatta a Gemini 3 Pro-t rekorddöntő látási képességekkel
Hivatalosan is elrajtolt a Gemini 3 Pro, amely a beszámolók szerint az iparági tesztek többségében legyőzi a GPT-5.1-et és a Claude 3.5 Sonnet-et, az SWE-Bench Verified teszt kivételével. Bár a modellt az általános érvelés terén csak kismértékben nevezik okosabbnak elődeinél, a legjelentősebb előrelépés a vizuális feldolgozásban történt. A képernyőfotók értelmezését vizsgáló benchmark teszten kiemelkedő, 72,7%-os eredményt ért el, míg a jelenlegi második legjobb modell csupán 36,2%-ot teljesít. Az új modell gyorsabb a Gemini 2.5 Pro-nál, bár a fejlesztők számára némileg magasabb áron érhető el. A bevezetés egybeesik egy új Google IDE megjelenésével is, amely Agent Managert és egy beépített böngészőt tartalmaz az ágensek által készített építmények megtekintéséhez és teszteléséhez.
- Szinte minden benchmark teszten felülteljesíti a GPT-5.1-et és a Sonnet 4.5-öt, az SWE-Bench kivételével.
- 72,7%-os eredményt ért el a képernyőfotók értelmezésében, megduplázva a korábbi 36,2%-os iparági csúcsot.
- Javult a teljesítménye a frontend fejlesztés és a kódmódosítások véglegesítése (commit) terén.
- Egy új fejlesztői környezettel együtt jelent meg, amely speciális „artifact”-okat tartalmaz a feladatkezeléshez.
- Beharangozták a Gemini 3 Deep Think modellt, amely AI módban integrálódik a Google Search-be.
- Megjelent a Gemini Agent az ultra-előfizetők számára, új Dynamic UI felülettel a chaten belül.
Miért fontos?
A látási képességek terén elért hatalmas ugrás a megbízhatóbb multimodális ágensek felé történő elmozdulást sugallja, amelyek képesek eligazodni az összetett felhasználói felületeken – ez egy olyan feladat, amelyben a korábbi modellek gyakran kudarcot vallottak. ---