A Meta bemutatta a Movie Gen-t az AI videógeneráláshoz és -szerkesztéshez

2024. október 14. · MI Történik? · 1 perc olvasás

A Facebook kifejlesztette a Movie Gen-t, egy olyan generatív modellcsaládot, amely filmek készítésére és szerkesztésére használható. Ezek a modellek képesek szövegből videót generálni, videókat szöveges utasításokkal szerkeszteni, és személyre szabott videókat készíteni (például ha feltöltesz magadról egy fotót, a modell köréd építi a videót). A Facebook egyelőre nem teszi közzé ezeket a modelleket – „a Movie Gen alapmodell-családját kutatási célokra fejlesztettük, és további javításokra van szükség a bevezetésük előtt” – írta a Facebook.

Képes kiváló minőségű videókat generálni közvetlenül szöveges utasításokból (promptekből).
Támogatja a videószerkesztési funkciókat természetes nyelvű utasítások segítségével.
Személyre szabott videók készítésére képes egyetlen, a felhasználó által megadott fénykép alapján.
A Meta Grand Teton AI szerverplatformján tanították, akár 6144 darab H100 GPU felhasználásával.
A tanítás során használt minden egyes H100 GPU 700W TDP-vel és 80GB HBM3 memóriával működött.

Miért fontos?

A videógyártás hamarosan tucatárúvá válik: Ahogyan a szöveg- és képgenerálás már „szokványos AI” szolgáltatássá vált (ahol bár léteznek zárt modellek, viszonylag könnyen hozzáférhetünk rendkívül olcsó vagy open-source változatokhoz), a videómodellek is ebbe az irányba haladnak. Úgy tűnik, a Facebook az egyik legesélyesebb szereplő az ilyen modellek nyílt elterjesztésére, ezért érdemes figyelemmel kísérni a Movie Gen-t, hogy lássuk, mi válhat hamarosan széles körben elérhetővé az interneten.

Eredeti forrás megtekintése (angol) →