MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Gemini 1.5 multimodális képességei támogatják a hosszú videók valós világú elemzését

A Gemini 1.5 multimodális képességei számos olyan valós alkalmazást tesznek lehetővé, amellyel más modellek nem tudnak versenyre kelni, például órás videók vagy teljes könyvek feldolgozását és elemzését a 2 millió tokenes kontextusablaknak köszönhetően. Kilpatrick kiemelte, hogy az a képesség, hogy egy órás videót bedobhatunk az AI Studio-ba és kérdéseket tehetünk fel róla, "észbontó" élmény. Mivel a modellt az alapoktól kezdve multimodálisnak tervezték, nagyságrendekkel több fontos felhasználási esetet kínál a nem-szöveges adatokra támaszkodó fejlesztők és vállalkozások számára.

Miért fontos?

A Gemini 1.5 2 millió tokenes kontextusablaka lehetővé teszi hosszú formátumú tartalmak, például hosszú videók, teljes könyvek és terjedelmes podcastok feldolgozását és elemzését, új lehetőségeket nyitva a tartalomelemzés és az interakció terén. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Mondo Robotics bemutatta Benit, az autonóm kamerarobotot tartalomgyártók számára
4 órája
A Booster Robotics humanoidja falat is átütő rúgással debütált a futballbemutatón
7 órája
Az Aceii A1 mobil teniszrobot dinamikus AI-edzést kínál
7 órája
Tudj meg többet
ChatGPT vs Claude vs Gemini - Melyiket válaszd 2026-ban?
AI a tartalomgyártásban: Hogyan készíts profi videókat és prezentációkat percek alatt