MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Gemini 3.5 Flash „computer use” képességekkel bővült

A Google legújabb bejelentése jelentős mérföldkő az AI-alapú automatizálás terén, ugyanis a vállalat frissítette a Gemini 3.5 Flash modellt, amely immár képessé vált a számítógép-használatra, vagyis a „computer use” funkciók végrehajtására. Ez az újítás lehetővé teszi, hogy az AI közvetlenül vezéreljen böngészőket, valamint különböző mobil és asztali környezeteket, ezzel új távlatokat nyitva az önállóan cselekvő szoftverügynökök fejlesztése előtt. A technológia tesztelése és implementációja érdekében a Google egy nyilvános GitHub-tárhelyet is elérhetővé tett, amelyen keresztül a fejlesztők és az érdeklődők helyileg próbálhatják ki a rendszer képességeit, de a Browserbase platformmal való integrációnak köszönhetően a felhőalapú böngészőautomatizálás is zökkenőmentesen megvalósítható.

A „computer use” képesség integrálása a Gemini 3.5 Flash modellbe azért bír kiemelt jelentőséggel, mert ez az LLM a Google kínálatának egyik leggyorsabb és leghatékonyabb verziója. A kisebb, ám nagy teljesítményű modellek felruházása azzal a képességgel, hogy emberi módra navigáljanak egy felhasználói felületen, drasztikusan csökkenti az ágensalapú automatizálás költségeit és növeli a rendszer reszponzivitását. Míg a korábbi megoldások gyakran nehézkesek vagy drágák voltak, a Flash modell sebessége lehetővé teszi, hogy az AI szinte valós időben reagáljon a képernyőn történő változásokra, legyen szó egy weboldal kitöltéséről, alkalmazások közötti adatmozgatásról vagy komplex asztali munkafolyamatok automatizálásáról.

Ez a fejlesztés jól illeszkedik az AI-iparág általános trendjébe, ahol a fejlesztők már nem csupán szöveg- vagy kódgenerálásra, hanem komplex feladatok önálló megoldására kívánják használni az AI-ügynököket. A Google lépése, amellyel a fejlesztői közösség számára is elérhetővé tette az eszközt, azt jelzi, hogy a vállalat nyitott az ökoszisztéma fejlesztésére és az open-source megoldások támogatására. A Browserbase-zel való együttműködés különösen hasznos azoknak a startupoknak és fejlesztőknek, akik skálázható, felhőalapú környezetben kívánják futtatni az automatizált folyamataikat anélkül, hogy a lokális infrastruktúra korlátaival kellene megküzdeniük. A jövőben várhatóan egyre több hasonló megoldás jelenik meg, amelyek a számítógépes interfészek és az AI közötti határokat mossák el, hatékonyabbá téve ezzel a mindennapi digitális munkát.

Miért fontos?

A „computer use” képesség kiterjesztése a kisebb, gyorsabb modellekre, mint a Flash, költséghatékonyabbá és reszponzívabbá teszi az ágensalapú automatizálást.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Modal Auto Endpoints leegyszerűsíti a nyílt forráskódú modellek telepítését
most
A GPT-5.5 Instant frissítése javítja a szándékfelismerést és a megkötések betartását
1 órája
A Claude Tag elhozza a megosztott Claude Code példányokat a Slackbe
2 órája
Tudj meg többet
ChatGPT vs Claude vs Gemini - Melyiket válaszd 2026-ban?
Hogyan tanulj nyelvet AI-val? Gyakorlati útmutató ChatGPT-vel és Gemini-vel