A Stability AI közzétette a nyílt hozzáférésű Stable Video Diffusion modellt

2023. december 11. · MI Történik? · 1 perc olvasás

A Stability AI startup megjelentette a Stable Video Diffusiont, a nyíltan hozzáférhető szöveg-videó modellek családját. A modellek a licenc alapján a nem kereskedelmi felhasználók számára ingyenesen elérhetőek. „Miközben lelkesen frissítjük modelljeinket a legújabb fejleményekkel, és dolgozunk a visszajelzések beépítésén, hangsúlyozzuk, hogy ez a modell jelen szakaszában nem valódi piaci vagy kereskedelmi alkalmazásokra készült” – írta a Stability a modellt bejelentő blogbejegyzésében.

Nyíltan hozzáférhető szöveg-videó modellcsaládként jelent meg.
Ingyenesen elérhető nem kereskedelmi célú felhasználók számára.
Jelenleg nem valódi piaci vagy kereskedelmi alkalmazásokra szánják.
A Runway és a Pika Labs más versenyképes videógenerátorai mellett érkezik.

Miért fontos?

2022-ben a DALL-E2 és a Stable Diffusion elindítása hozta el az igazán jó, széles körben elterjedt szöveg-kép modellek korszakát. A Stable Video Diffusion szinte biztosan ugyanezt vetíti előre a szöveg-videó generálás terén, és olyan más jó videógenerátorok mellett érkezik, mint a Runway vagy az új startup, a Pika Labs termékei. Bár a generálási képességek nyilvánvalóan lenyűgözőek, érdekes lesz látni, hogy a nagy léptékű AI rendszerek (pl. nyelvi modellek) képesek lesznek-e kiaknázni az időben konzisztens vizuális modelleket a további intelligencia eléréséhez.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Boston Dynamics Spot robotok járőröznek a 2026-os FIFA Világbajnokság stadionjaiban

1 órája

Az AI pályára lép a labdarúgás legnagyobb színpadán

3 órája

Az XPeng vezérigazgatója irányítja a humanoid robotok sorozatgyártását

5 órája

Tudj meg többet

Midjourney vs DALL-E 3 vs Stable Diffusion