MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Gemini 1.5 multimodális képességei támogatják a hosszú videók valós világú elemzését

A Gemini 1.5 multimodális képességei számos olyan valós alkalmazást tesznek lehetővé, amellyel más modellek nem tudnak versenyre kelni, például órás videók vagy teljes könyvek feldolgozását és elemzését a 2 millió tokenes kontextusablaknak köszönhetően. Kilpatrick kiemelte, hogy az a képesség, hogy egy órás videót bedobhatunk az AI Studio-ba és kérdéseket tehetünk fel róla, "észbontó" élmény. Mivel a modellt az alapoktól kezdve multimodálisnak tervezték, nagyságrendekkel több fontos felhasználási esetet kínál a nem-szöveges adatokra támaszkodó fejlesztők és vállalkozások számára.
Miért fontos?

A Gemini 1.5 2 millió tokenes kontextusablaka lehetővé teszi hosszú formátumú tartalmak, például hosszú videók, teljes könyvek és terjedelmes podcastok feldolgozását és elemzését, új lehetőségeket nyitva a tartalomelemzés és az interakció terén. ---

Eredeti forrás megtekintése (angol) →