A Gemini sűrű, ágensi napja a Google I/O-n
A Google a legutóbbi I/O eseményén bemutatta a Gemini-alapú fejlesztések és funkciók legújabb, rendkívül sűrű hullámát, amely egyértelműen az autonóm ágensi képességek köré épül. A technológiai óriás egy sor áttörést hozó megoldást vonultatott fel, köztük az új Omni modellt, a rendkívül gyors Gemini 3.5 Flash-t, a folyamatosan működő Spark személyi ágenst, valamint az Antigravity 2.0-t. Emellett a felhasználók a Kereső radikális, ágensi alapú megújulásának is tanúi lehettek, ami alapjaiban formálja át az információgyűjtés eddig ismert módjait.
Az újdonságok technikai részletei lenyűgözőek, és jól mutatják a fejlesztések sokszínűségét. A bemutatott Gemini Omni képes arra, hogy a szöveges, képi, hang- vagy akár videóbemeneteket közvetlenül videókimenetté alakítsa; a vállalat nemes egyszerűséggel úgy jellemezte ezt a modellt, mint a „Nano Banana-t videókhoz”. Ezzel párhuzamosan debütált a Gemini 3.5 család első tagja, a Flash is. Ez a modell a különféle benchmarkteszteken megközelíti az olyan piaci riválisokat, mint az Opus 4.7 és a GPT-5.5, miközben négyszeres sebességet biztosít feleannyi költség mellett. A mindennapi produktivitást pedig a Gemini Spark hivatott támogatni: ez az új, a nap 24 órájában elérhető személyes ágens Google Cloud virtuális gépeken fut, és képes önálló műveleteket végrehajtani a Workspace, a Chrome, az e-mailek és a chat felületein.
A rendezvény másik óriási bejelentése a Google Kereső frissítése volt, amelyet a vállalat egy egész generáció óta a legnagyobb újratervezésként állított be. Az új Search keresztmodális bemeneteket, 24 órás információgyűjtő ágenseket és egyedi elrendezéseket biztosító generatív UI-t hoz magával a felhasználóknak. A bemutatott funkciók sora ezzel még nem ért véget, hiszen reflektorfénybe került a Gemini for Science, az Intelligent Eyewear okosszemüveg-technológia, a Street View szimulációk, valamint a biztonságot szolgáló SynthID AI-vízjelezés is.
A legfontosabb vezérfonal ezen frissítések mögött egyértelműen az, hogy a Google egy sokkal ágensebb, multimodálisabb Gemini rendszert integrál a teljes alkalmazáscsomagjába, méghozzá monumentális léptékben. Bár a Gemini 3.5 Flash benchmarkjai önmagukban nem söprik el a közvetlen konkurenciát, a gyorsaság, az alacsony költségek és az élvonalat megközelítő képességek ötvözése rendkívül erőteljes kombinációt alkot. Mivel ezeket az átlagfelhasználó-barát eszközöket már most is felhasználók milliói használják nap mint nap, a gyors és olcsó megoldások integrálása hatalmas előnyt jelenthet a piacon.
- A Gemini Omni képes a szöveges, képi, hang- vagy videóbemeneteket videókimenetté alakítani; a Google a modellt úgy jellemezte, mint a „Nano Banana-t videókhoz”.
- A Gemini 3.5 család a Flash-sel indul, amely a különféle benchmarkteszteken megközelíti az olyan riválisokat, mint az Opus 4.7 és a GPT-5.5, négyszeres sebesség mellett és feleannyi költséggel.
- A Gemini Spark egy új, a nap 24 órájában elérhető személyes ágens, amely Google Cloud virtuális gépeken fut, hogy ágensi műveleteket hajtson végre a Workspace, a Chrome, az e-mailek és a chat felületein.
- A Google a Kereső (Search) frissítését egy generáció óta a legnagyobb újratervezésként állította be, amely keresztmodális bemeneteket, 24 órás információgyűjtő ágenseket és egyedi elrendezéseket biztosító generatív UI-t hoz magával.
- A további funkciók és eszközök között szerepelt a Gemini for Science, az Intelligent Eyewear (részletek lentebb), a Street View szimulációk, a SynthID AI-vízjelezés és még sok más.
A legfontosabb vezérfonal ezen frissítések mögött: egy ágensebb, multimodálisabb Gemini integrálása a Google teljes alkalmazáscsomagjába, méghozzá nagyszabásúan. A 3.5 Flash benchmarkjai ugyan nem söprik el a konkurenciát, de a gyors, olcsó és az élvonalat megközelítő képességek ötvözése azokkal az átlagfelhasználó-barát eszközökkel, amelyeket felhasználók milliói már most is használnak, rendkívül erőteljes. ---