MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Meta és a Stanford Bemutatja az Apollót a Fejlett Videóértelmezéshez

A videóértelmezés eddig lemaradt a szöveges, képi és hangmódszerek mögött – egészen mostanáig. A Meta és a Stanford kutatói bemutatták az Apollót, a legkorszerűbb videóközpontú nagy multimodális modellek (video-LMM-ek) új családját, amelynek célja ezen rés betöltése. A korábbi próbálkozásokkal ellentétben az Apollo új szabványt állít fel azáltal, hogy hatékonyan elemzi az órás videókat, és áttörő eredményeket ér el számos benchmarkon.
Miért fontos?

Az Apollo kiváló videóértelmezési képességei utat nyitnak az áttöréseknek, mint például a valós idejű videóösszefoglalás tartalomgyártók számára, a jobb időbeli érvelés az orvosi diagnosztikában, és a továbbfejlesztett videóanalitika az önvezető járművekhez. Az Apollóval a videóértelmezés végre felzárkózhat multimodális társaihoz. ---

Eredeti forrás megtekintése (angol) →