AI KUTATÁS
A ByteDance bemutatja a Goku modellcsaládot kép- és videógeneráláshoz
A ByteDance és a Hongkongi Egyetem bemutatta a Goku és Goku+ modelleket, egy olyan AI modellcsaládot, amely áthidalja a kép- és videógenerálás közötti szakadékot. Kiváló teljesítményt nyújtanak több vizuális benchmarkon is, és hiperrealisztikus kereskedelmi tartalmakat tesznek lehetővé reklámokhoz és marketinghez.
- A Goku csúcsteljesítményt ér el a főbb benchmarkokon, rekordokat döntve mind a kép-, mind a videóminőség terén egy egységes architektúrával, amely mindkét feladatot kezeli.
- Egy fejlett „rectified flow” technika teszi lehetővé a zökkenőmentes átmenetet a képek és videók között; a rendszert 160 millió képen és 36 millió videón tanították.
- A továbbfejlesztett Goku+ kifejezetten a hirdetési és marketing igényeket célozza meg, fotorealisztikus emberi avatarok és termékbemutatók létrehozásának képességével.
- A + platform speciális eszközöket tartalmaz a termékfotók videoklipekké alakításához, valamint valósághű ember-termék interakciók létrehozásához kereskedelmi tartalmakhoz.
Miért fontos?
A Goku képessége a kiterjesztett, kiváló minőségű kereskedelmi tartalmak és termékbemutatók létrehozására azt mutatja, hogy az AI videógyártás a kifinomultság új szintjére lépett. Ez átalakítja a marketingtartalmak készítésének és fogyasztásának módját, de egyben minden eddiginél nehezebbé teszi az AI generációk megkülönböztetését a valóságtól. ---