GENMO
A Genmo kiadta a Mochi 1 open-source AI videómodellt
A Genmo AI startup elindította a Mochi 1-et, egy új open-source videógeneráló modellt, amely azt állítja, hogy felveszi a versenyt a zárt riválisokkal, mint a Runway, a Pika és a Kling — miközben szabadon hozzáférhető a fejlesztők és kutatók számára.
- A Mochi egy új, 10 milliárd paraméteres, AsymmDiT elnevezésű architektúrára épül, amivel az eddigi legnagyobb teljesítményű open-source videógeneráló modell.
- A modell kiemelten fókuszál a mozgás minőségére és a promptok pontos követésére; 480p felbontású videókat készít 30 fps mellett, legfeljebb 5,4 másodperc hosszúságban.
- A tesztelések során a Mochi a mozgás minőségében és a prompt-hűségben megelőzte az olyan csúcsmodelleket, mint a Kling, a Runway Gen-3, a Luma Dream Machine-ja és a Pika.
- Egy nagyobb felbontású verzió, a Mochi 1 HD, amely már 720p támogatással és képből-videóba (image-to-video) funkciókkal érkezik, az év végére várható.
- A Genmo azt is bejelentette, hogy 28,4 millió dolláros Series A finanszírozást biztosított, a Mochi 1 pedig a vállalat első lépése a „világszimulátorok” építése felé.
Miért fontos?
Az open-source AI videó hivatalosan is felzárkózott a piacvezetőkhöz. A Genmo Mochi modellje egy rendkívül lenyűgöző megjelenés, amely jól mutatja, mennyire kompetitívvé válik a videógenerálás területe — különösen, hogy a legnagyobb szereplők (Sora, Midjourney?) válaszai még csak ezután várhatóak. ---