MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Google a nyers SDK-támogatáson keresztül fejleszti a Gemini 2.5 videóértelmezési képességét

A Google feszegeti a határokat abban, hogy a Gemini mit képes megérteni a videókból. A Gemini modellek az első naptól kezdve alkalmasak voltak erre. Technikailag ez nem „videó”, hanem képek (másodpercenként 1 képkockás mintavételezéssel) és hang összefűzve. Korábban a) a teljesítmény nem volt az igazi, és b) fejlesztőként magadnak kellett megoldanod a hang, a képek stb. manuális átadását. 2024 vége óta a Gemini képes közvetlenül fogadni a nyers videót az SDK-n keresztül, az új Gemini 2.5 modellek pedig annyira jók, hogy az 1 fps mintavételezés a legtöbb feladathoz elegendő.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A hírek szerint a Meta 15 milliárd dollárért fektet be a Scale AI-ba
2025. június 12.
A ByteDance bemutatta a SeedDance videómodellt a Veo-3 riválisaként
2025. június 12.
A Mistral kiadta a Magistral reasoning modelleket és vállalati infrastruktúráját
2025. június 12.
Tudj meg többet
Gemini a Gmail-ben és a Google Docs-ban: Így automatizáld a munkád
Gemini AI: A Google mesterséges intelligenciája közérthetően