MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Wan Video nyílt forráskódú modellt adott ki szinkronizált beszélőfej-generáláshoz

A Wan Video kiadott egy új, Wan-S2V nevű nyílt forráskódú AI modellt, amely lehetővé teszi a felhasználók számára, hogy egyetlen statikus képből és egy hangfájlból beszélőfejes videókat hozzanak létre. A modell szinkronizálja a személy száj- és arcmozgását a megadott hanggal, valósághű videót készítve a beszélő alanyról. Ez a 14 milliárd paraméteres modell elérhetővé vált a fejlesztői közösség számára a GitHubon és a HuggingFace-en, kiváló minőségű nyílt forráskódú alternatívát kínálva a saját fejlesztésű videószintézis-eszközökkel szemben.

Miért fontos?

A kiváló minőségű, nyílt forráskódú videógeneráló modellek elérhetősége demokratizálja a szintetikus média létrehozását, és lehetővé teszi a fejlesztők számára, hogy speciális alkalmazásokat építsenek a zárt, fizetős ökoszisztémákon kívül. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A különbségek megértése: Skill-ek, Project-ek, GPT-k, Agent-ek és Plugin-ek
1 napja
A Google frissítette a NotebookLM-et forrás-jóváhagyással és többféle exportálási formátummal
3 napja
Az Alexa for Shopping már egyedi ajándéktárgyakat generál promptok alapján
4 napja
Tudj meg többet
Ingyenes AI eszközök 2026 - Top 15