A Google integrálja a Gemini ágenseket a Kereső, a Workspace és az Android ökoszisztémákba
A Google az éves I/O konferenciáján egyértelművé tette a jövőre vonatkozó stratégiáját: a Gemini mesterséges intelligencia immár nem csupán egy különálló chatbot, hanem az a központi infrastruktúra és operációs réteg, amely a vállalat teljes ökoszisztémája alatt fut majd. A Kereső, a Workspace alkalmazások és az Android rendszer mind megkapják ezeket a mélyen integrált AI ágenseket. Ezzel a lépéssel a technológiai óriás egyértelműen a saját terjesztési előnyére épít, hiszen a felhasználók számára nem egy újabb szoftver bevezetéséről van szó, hanem a már meglévő és nap mint nap használt felületeik és eszközeik észrevétlen, mégis radikális továbbfejlesztéséről.
A bejelentett részletek alapján az átalakulás rendkívül látványos és sokrétű. Bemutatkozott a Gemini 3.5 Flash, amely egy kifejezetten gyors, hosszú feladatokra és kódolásra optimalizált modell, míg a Gemini Spark egy 24 órás személyes asszisztensként funkcionál majd a Workspace alkalmazások között. A Kereső ezentúl információgyűjtő ágensekkel figyeli a webet, a Gmail, a Docs és a Keep pedig fejlett hangfunkciókat kap az AI Inbox és a Google Pics mellett. A fejlesztők számára is komoly újdonságokat hoz a System 2.0 verzió, amely a kódoló ágenseket menedzselt asztali környezetté, CLI és SDK munkafolyamattá alakítja, sőt, párhuzamos kódoló ágensekből álló csapatok indítását is lehetővé teszi, míg az AI Studio segítségével már teljes Android alkalmazások is generálhatók.
Ez a stratégia komoly versenyelőnyt jelent az olyan dedikált célszoftverekkel szemben, mint az OpenAI ChatGPT-je vagy az Anthropic Claude-ja. Míg ezekhez a felhasználóknak új szokásokat kell kialakítaniuk, addig a Google birtokolja a legfontosabb digitális munkafelületeket: a bejövő fiókot, a böngészőt, a dokumentumokat, a telefont, a YouTube-ot és a vásárlási felületeket. A legnagyobb kihívást most a felhasználói bizalom és a jogosultságok megszerzése jelenti. Egy dolog ugyanis egy kérdésekre válaszoló keresőmotort használni, és egy teljesen más szint, amikor egy olyan AI ágensre bízzuk rá magunkat, amely önállóan figyel, foglal, vásárol, épít, ír és szerkeszt helyettünk a háttérben.
A valódi tét tehát hatalmas, hiszen az AI-verseny súlypontja elmozdult a puszta szöveges válaszadástól afelé, hogy melyik vállalat képes a válaszokat valós tettekké alakítani. A Google válasza erre az, hogy a Geminit a kereséstől a Gmailen, a YouTube-on és az Androidon át egészen az okosszemüvegekig mindenbe beépíti. Ha a Google tervei beválnak, a jövőbeli felhasználói felület már nem a hagyományos chatbotokkal való beszélgetésre fog hasonlítani. Ehelyett eljutunk oda, hogy a felhasználónak egyszerűen csak el kell mondania a számítógépének, milyen végeredményt szeretne látni, és az intelligens infrastruktúra automatikusan elvégzi a munkát.
- A Gemini 3.5 Flash lett a Google új gyors modellje az ágensekhez, kódoláshoz és hosszú feladatokhoz.
- A Gemini Spark 24 órás személyes ágensként mutatkozott be, amely képes a Workspace alkalmazásokon átívelően működni.
- A Kereső információgyűjtő ágenseket kapott, amelyek figyelik a webet, valamint minialkalmazásokat a folyamatban lévő feladatokhoz.
- A Workspace hangfunkciókat kapott a Gmailhez, a Docshoz és a Keephez, valamint megjelent a Google Pics és az AI Inbox.
- A rendszer 2.0-s verziója a kódoló ágenseket egy menedzselt asztali környezetté, CLI és SDK munkafolyamattá alakította, valamint lehetővé tette párhuzamos kódoló ágensekből álló csapatok indítását.
- Az AI Studio segítségével mostantól teljes Android alkalmazások generálhatók.
A valódi történet azonban meglehetősen egyszerű: a Google azt szeretné, ha a Gemini már nem csak egy chatbotnak tűnne, hanem a keresés, az e-mailek, a dokumentumok, a vásárlás, a videók, a szemüvegek, a kódolás és az alkalmazáskészítés operációs rétegévé válna. Egy bizonyos ponton az asszisztens bepréselése az alkalmazásokba véget ért, és mostantól az alattuk lévő infrastruktúrává válik. Ez azért fontos a Google számára, mert az AI-verseny elmozdult a „melyik chatbot válaszol a legjobban?” kérdéstől a „melyik vállalat képes a válaszokat tettekké alakítani?” felé. A Google válasza egyértelmű: tegyük a Geminit mindenbe bele, a Keresőtől, a Gmailtől, a Docstól kezdve a YouTube-on, a vásárláson, az Androidon, a kódoláson, az alkalmazásfejlesztésen át egészen a szemüvegekig. ---