Megérkezett a DeepMind válasza a Midjourney-re
A Google DeepMind bejelentette az Imagen 2-t, az eddigi legfejlettebb szövegből képalkotó (text-to-image) technológiáját. A Google legújabb AI kutatásaira épülő Imagen 2 kiváló minőségű, fotorealisztikus képeket hoz létre, amelyek a korábbi verzióknál pontosabban illeszkednek a felhasználói promptokhoz.
A modell jelentős fejlődést mutat a generatív AI számára nehézséget okozó területeken, mint például az emberi kéz ábrázolása vagy a képeken belüli szövegek pontos megjelenítése. Az eszközt már integrálják a Google ökoszisztémájába, a vállalati ügyfelek számára pedig elérhető a Google Cloud Vertex AI platformján keresztül.
- A DeepMind által kifejlesztett fejlett text-to-image diffúziós technológia
- Fokozott fotorealizmus és jelentősen javult prompt-illeszkedés
- Tartalmazza a folyékony inpainting és outpainting funkciókat
- Vállalati felhasználásra elérhető a Vertex AI-on keresztül
Miért fontos?
Az Imagen 2-vel a Google közvetlen versenytársa lett az olyan vezető képgenerátoroknak, mint a Midjourney és a DALL-E 3, különösen a kereskedelmi és vállalati alkalmazások területén. ---