A Meta bemutatta a Movie Gen-t az AI videógeneráláshoz és -szerkesztéshez
A Facebook kifejlesztette a Movie Gen-t, egy olyan generatív modellcsaládot, amely filmek készítésére és szerkesztésére használható. Ezek a modellek képesek szövegből videót generálni, videókat szöveges utasításokkal szerkeszteni, és személyre szabott videókat készíteni (például ha feltöltesz magadról egy fotót, a modell köréd építi a videót). A Facebook egyelőre nem teszi közzé ezeket a modelleket – „a Movie Gen alapmodell-családját kutatási célokra fejlesztettük, és további javításokra van szükség a bevezetésük előtt” – írta a Facebook.
- Képes kiváló minőségű videókat generálni közvetlenül szöveges utasításokból (promptekből).
- Támogatja a videószerkesztési funkciókat természetes nyelvű utasítások segítségével.
- Személyre szabott videók készítésére képes egyetlen, a felhasználó által megadott fénykép alapján.
- A Meta Grand Teton AI szerverplatformján tanították, akár 6144 darab H100 GPU felhasználásával.
- A tanítás során használt minden egyes H100 GPU 700W TDP-vel és 80GB HBM3 memóriával működött.
Miért fontos?
A videógyártás hamarosan tucatárúvá válik: Ahogyan a szöveg- és képgenerálás már „szokványos AI” szolgáltatássá vált (ahol bár léteznek zárt modellek, viszonylag könnyen hozzáférhetünk rendkívül olcsó vagy open-source változatokhoz), a videómodellek is ebbe az irányba haladnak. Úgy tűnik, a Facebook az egyik legesélyesebb szereplő az ilyen modellek nyílt elterjesztésére, ezért érdemes figyelemmel kísérni a Movie Gen-t, hogy lássuk, mi válhat hamarosan széles körben elérhetővé az interneten.