A Google bemutatta a Muse-t, egy gyors és hatékony text-to-image modellt

2023. január 4. · MI Történik? · 1 perc olvasás

Azt állítják, hogy jobb, gyorsabb és minden szükséges kiegészítőt tartalmaz. A Google-nek nagy éve volt 2022 a text-to-image területén, tavaly nyáron két modellt is kiadtak Imagen és Parti néven. Most itt a Muse, egy modell, amely egy régebbi architektúrához nyúl vissza, és úgy gondolják, lepipálja a jelenlegi kedvenceket. A Stable Diffusion, a DALL-E 2 és a Midjourney mind diffúziós modellek. Működésük meghaladja e hírlevél kereteit, de annyit érdemes tudni, hogy lassúak. Például a Stable Diffusion-nek 18,5 másodpercbe telt a legjobb kép generálása. A Muse-nak ez 1,3 másodperc, és még jobb eredményt is produkál. Ráadásul a szerkesztési funkció is be van építve – ami a Stable Diffusion-nél csak kiegészítő.

Miért fontos?

Jól hangzik? Kezeljük fenntartásokkal. A Muse még nem open-source, és nem érhető el a nyilvánosság számára. Akkor tudjuk meg, hogy valóban beváltja-e az ígéreteit, ha mi magunk is kipróbálhatjuk. ---

Eredeti forrás megtekintése (angol) →