MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Google bemutatta a Gemini 2.5 „computer-use” modelljét böngészőautomatizáláshoz

A Google közzétette első, a Gemini 2.5-ön alapuló „computer-use” (számítógéphasználati) modelljének előzetesét a Browserbase-szel együttműködésben. A benchmark teszteken tisztességesen jobb eredményt ér el, mint a Sonnet 4.5, és sokkal jobbat, mint az OpenAI hasonló modellje. A benchmarkok és értékelések azonban félrevezetők lehetnek, különösen, ha csak a hivatalos bejelentésekre hagyatkozunk. A legfrissebb pontszámok és a tesztek pontos implementációjának felkutatása nehéz, a cégek pedig marketingposztjaikban gyakran kerülik az árnyalt fogalmazást. Mindenesetre az új Gemini modell átment a hatékonyságot vizsgáló kezdeti alapvető teszteken (smoke tests).
Miért fontos?

Felhasználóként meg kell értenünk a modellciklusokat és a marketing benchmarkok árnyalatait, hogy megkülönböztessük a technikai áttöréseket a kreatív adatábrázolástól. ---

Eredeti forrás megtekintése (angol) →