Megérkezett a DeepMind válasza a Midjourney-re

2023. december 14. · MI Történik? · 1 perc olvasás

A Google DeepMind bejelentette az Imagen 2-t, az eddigi legfejlettebb szövegből képalkotó (text-to-image) technológiáját. A Google legújabb AI kutatásaira épülő Imagen 2 kiváló minőségű, fotorealisztikus képeket hoz létre, amelyek a korábbi verzióknál pontosabban illeszkednek a felhasználói promptokhoz.

A modell jelentős fejlődést mutat a generatív AI számára nehézséget okozó területeken, mint például az emberi kéz ábrázolása vagy a képeken belüli szövegek pontos megjelenítése. Az eszközt már integrálják a Google ökoszisztémájába, a vállalati ügyfelek számára pedig elérhető a Google Cloud Vertex AI platformján keresztül.

A DeepMind által kifejlesztett fejlett text-to-image diffúziós technológia
Fokozott fotorealizmus és jelentősen javult prompt-illeszkedés
Tartalmazza a folyékony inpainting és outpainting funkciókat
Vállalati felhasználásra elérhető a Vertex AI-on keresztül

Miért fontos?

Az Imagen 2-vel a Google közvetlen versenytársa lett az olyan vezető képgenerátoroknak, mint a Midjourney és a DALL-E 3, különösen a kereskedelmi és vállalati alkalmazások területén. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Boston Dynamics Spot robotok járőröznek a 2026-os FIFA Világbajnokság stadionjaiban

1 órája

Az AI pályára lép a labdarúgás legnagyobb színpadán

3 órája

Az XPeng vezérigazgatója irányítja a humanoid robotok sorozatgyártását

5 órája

Tudj meg többet

AI keresőoptimalizálás (GEO): Hogyan kerülj be a ChatGPT és a Perplexity válaszaiba?