MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Stability AI közzétette a nyílt hozzáférésű Stable Video Diffusion modellt

A Stability AI startup megjelentette a Stable Video Diffusiont, a nyíltan hozzáférhető szöveg-videó modellek családját. A modellek a licenc alapján a nem kereskedelmi felhasználók számára ingyenesen elérhetőek. „Miközben lelkesen frissítjük modelljeinket a legújabb fejleményekkel, és dolgozunk a visszajelzések beépítésén, hangsúlyozzuk, hogy ez a modell jelen szakaszában nem valódi piaci vagy kereskedelmi alkalmazásokra készült” – írta a Stability a modellt bejelentő blogbejegyzésében.
Miért fontos?

2022-ben a DALL-E2 és a Stable Diffusion elindítása hozta el az igazán jó, széles körben elterjedt szöveg-kép modellek korszakát. A Stable Video Diffusion szinte biztosan ugyanezt vetíti előre a szöveg-videó generálás terén, és olyan más jó videógenerátorok mellett érkezik, mint a Runway vagy az új startup, a Pika Labs termékei. Bár a generálási képességek nyilvánvalóan lenyűgözőek, érdekes lesz látni, hogy a nagy léptékű AI rendszerek (pl. nyelvi modellek) képesek lesznek-e kiaknázni az időben konzisztens vizuális modelleket a további intelligencia eléréséhez.

Eredeti forrás megtekintése (angol) →