MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Twelve Labs elindította a videóértelmező Pegasus-1 modellt

A jelenlegi AI modellek általában szövegeket, PDF-eket, képeket és táblázatokat értenek meg. Ezen a héten a Twelve Labs elindította a „Pegasus-1”-et, egy olyan modellt, amely érti a videókat. A Pegasus képes „megnézni” egy videót, és elmondani, mi történt benne. Feltölthetünk például egy Mr. Beast videót, és kikérdezhetjük a modellt arról, hogy az arckifejezések és a kellékek hogyan járulnak hozzá a tartalomhoz. Vagy rábízhatjuk az AI-ra bármilyen YouTube, TikTok vagy biztonsági kamera felvételének összefoglalását.
Miért fontos?

Ez az alkalmazások egy teljesen új kategóriáját hozza létre, mivel eddig a robotok alapvetően vakok voltak. Képzelje el az ebben rejlő lehetőségeket: az ezzel a technológiával felturbózott biztonsági kamerák mellett még egyetlen zokni ellopása a mosodából is sokkal kockázatosabbá vált! ---

Eredeti forrás megtekintése (angol) →