KLING
Kling 3.0: jobb konzisztenciával és hanggal frissül az AI-videógenerálás
A kínai Kling AI-videós startup megjelentette a Kling 3.0-át, amely egyetlen multimodális modellbe ötvözi a text-to-video, image-to-video és natív hanggenerálási funkciókat, hosszabb kimenetekkel és továbbfejlesztett karakter- és jelenetkonzisztenciával.
- A 3.0-ás verzió egyesíti a korábbi modellcsaládokat egy egységes rendszerbe, natívan támogatja a 15 másodperces klipeket, és egy új Multi-Shot módot kínál, amely automatikusan generál különböző kameraállásokat.
- Jelentős fejlődés történt a konzisztencia terén: a modell immár képes vizuális jegyeket rögzíteni a snittek között, képi vagy videós referenciákat használva újrafelhasználható „horgonyként”.
- A natív hanggenerálás mostantól támogatja a hangklónozást több karakter esetében is, valamint bővült a választható nyelvek köre a természetes, többnyelvű párbeszédekhez.
- A frissítés jelenleg csak a Kling Ultra-szintű előfizetői számára érhető el, a szélesebb körű bevezetés a jövő héten várható.
Miért fontos?
A Kling folyamatosan az AI-videós ranglisták élmezőnyében szerepel – és bár a 3.0-hoz még nem érkeztek független mérések, úgy tűnik, újabb lépést tesznek a technológiai élvonal felé. Storyboard eszközei és egységesített rendszere az iparági trendeket követik: a valódi produkciós munkafolyamatok felé mutatnak, ahol a vezérlés, a hang és a tervezés már a rendszer szerves része. ---