Kling

Kling 3.0: jobb konzisztenciával és hanggal frissül az AI-videógenerálás

2026. február 5. · MI Történik? · 1 perc olvasás

A kínai Kling AI-videós startup megjelentette a Kling 3.0-át, amely egyetlen multimodális modellbe ötvözi a text-to-video, image-to-video és natív hanggenerálási funkciókat, hosszabb kimenetekkel és továbbfejlesztett karakter- és jelenetkonzisztenciával.

A 3.0-ás verzió egyesíti a korábbi modellcsaládokat egy egységes rendszerbe, natívan támogatja a 15 másodperces klipeket, és egy új Multi-Shot módot kínál, amely automatikusan generál különböző kameraállásokat.
Jelentős fejlődés történt a konzisztencia terén: a modell immár képes vizuális jegyeket rögzíteni a snittek között, képi vagy videós referenciákat használva újrafelhasználható „horgonyként”.
A natív hanggenerálás mostantól támogatja a hangklónozást több karakter esetében is, valamint bővült a választható nyelvek köre a természetes, többnyelvű párbeszédekhez.
A frissítés jelenleg csak a Kling Ultra-szintű előfizetői számára érhető el, a szélesebb körű bevezetés a jövő héten várható.

Miért fontos?

A Kling folyamatosan az AI-videós ranglisták élmezőnyében szerepel – és bár a 3.0-hoz még nem érkeztek független mérések, úgy tűnik, újabb lépést tesznek a technológiai élvonal felé. Storyboard eszközei és egységesített rendszere az iparági trendeket követik: a valódi produkciós munkafolyamatok felé mutatnak, ahol a vezérlés, a hang és a tervezés már a rendszer szerves része. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Megjelent a Kling O1, az all-in-one videógeneráló és -szerkesztő rendszer

2025. december 2.

Bejelentették a FLUX 3-at multimodális videó- és hangpredikcióval

most

A Cursor lokális, 7 dolláros „Start” csomagot indít Indiában

2 órája

Tudj meg többet

A legjobb AI Chrome bővítmények: Így turbózd fel a böngésződet

AI-alapú hangfelvétel-leírás és jegyzetelés: A legjobb eszközök magyarul