A Google DeepMind számítógép-használati funkciókkal bővítette a Gemini 3.5 Flash modellt
A Google DeepMind legújabb fejlesztéseként jelentős frissítést hajtott végre a Gemini 3.5 Flash modellen, amely immár közvetlenül beépített számítógép-használati funkciókkal rendelkezik. Ez az újítás lehetővé teszi a modell számára, hogy autonóm módon navigáljon különböző digitális környezetekben, beleértve a webböngészőket, az asztali alkalmazásokat és az operációs rendszer felületeit is. Ezzel a lépéssel a Google technológiája képessé válik az emberi felhasználók digitális munkafolyamatainak támogatására, képes kezelni a szoftveres interfészeket, kattintani, gépelni és az alkalmazásokon belüli navigációt önállóan elvégezni.
Ez a technológiai előrelépés nem elszigetelt jelenség, hanem a mesterséges intelligencia fejlesztésének egy fontos trendjébe illeszkedik, amely során a frontier modellek egyre inkább túllépnek a tisztán szöveges vagy vizuális adatfeldolgozáson. A Gemini 3.5 Flash fejlesztése során a cél egy olyan agens alapú működés támogatása volt, amely képes valódi, digitális feladatok végrehajtására. A versenytársak, mint például az OpenAI vagy az Anthropic fejlesztései is hasonló irányt mutatnak, ahol az LLM rendszerek már nem csupán passzív tudásbázisként vagy tartalomgenerátorként funkcionálnak, hanem proaktív digitális munkatársként, amelyek képesek a felhasználói utasításokat több lépésből álló, komplex szoftveres cselekvésekké konvertálni.
A fejlesztés fontossága abban rejlik, hogy drasztikusan lerövidíti a szakadékot az AI által generált tervek és a tényleges szoftveres kivitelezés között. Ahelyett, hogy egy felhasználónak manuálisan kellene adatokat másolnia különböző alkalmazások között, vagy ismétlődő, adminisztratív kattintgatással töltenie az idejét, a számítógép-használati képességekkel felvértezett Gemini 3.5 Flash képes ezeket a folyamatokat automatizálni. Ez az API szintű integráció megnyitja az utat az olyan fejlett szoftverügynökök előtt, amelyek a munkahelyi hatékonyság növelésében és a digitális környezetek kezelésében játszhatnak kulcsszerepet. A technológia elterjedése alapjaiban változtathatja meg a digitális eszközökkel való interakcióinkat, hiszen a jövőben az operációs rendszerek használata egyre kevésbé lesz a közvetlen emberi beavatkozáshoz kötve.