A Google közzétette a Gemini 2.5-ön alapuló első computer-use modelljének előnézetét
A Google megjelentette a Gemini 2.5 alapú első computer-use modelljének előnézetét, amelyet a Browserbase-szel partnerségben fejlesztettek ki. A modellt kifejezetten böngészőhasználatra optimalizálták, ezzel a Google is belépett azon ágensek piacára, amelyek képesek navigálni és interakcióba lépni a számítógépes felületekkel. A kezdeti mérések szerint a modell jobban teljesít az Anthropic Sonnet 4.5-jénél, és jelentősen felülmúlja az OpenAI jelenlegi computer-use modelljét.
- Kifejezetten böngészőalapú feladatokra optimalizálva.
- Az iparági méréseken (benchmarks) jobb pontszámot ér el, mint a Sonnet 4.5 és az OpenAI computer-use modellje.
- A Browserbase-szel való partnerség biztosítja az értékeléshez szükséges infrastruktúrát.
- Összetett, több lépésből álló feladatok kezelésére tervezték webböngésző környezetben.
Miért fontos?
Bár az eredmények ígéretesek, a felhasználóknak érdemes óvatosan kezelniük a marketing célú összehasonlításokat; például az OpenAI összehasonlítás alapjául szolgáló modellje már 7 hónapos. Mindazonáltal ez a modell átmegy az alapvető használhatósági teszten az automatizált webes navigáció területén. ---