AI KÉPGENERÁLÁS
A Google elindította a fejlett karakterkonzisztenciával rendelkező Gemini 2.5 Flash Image-et
A Google kiadta régóta várt új képmodelljét, amely a „nano-banana” kódnevet viseli, hivatalos neve pedig Gemini 2.5 Flash Image. Ez a modell az AI képgenerálás egy régóta fennálló kihívására ad választ: a karakterek hasonlóságának megőrzésére a különböző képeken. A felhasználók mostantól ugyanazt a karaktert helyezhetik el különféle környezetekben – például sivatagban, víz alatt vagy diszkóban –, és a vizuális megjelenésük konzisztens marad. A modell jelenleg ingyenesen kipróbálható az AI Studio felületén. A kiadás olyan speciális sablonokat is tartalmaz, mint a PixShop a fotószerkesztéshez, a Co-drawing a vázlatok javításához és a Home Canvas több kép zökkenőmentes egyesítéséhez. Képenkénti 0,039 dolláros árával rendkívül megfizethető professzionális eszközként pozicionálják, és már integrálták olyan platformokba, mint az OpenRouter, a fal.ai és az Adobe Firefly.
- Kimagasló karakterkonzisztenciát ér el különböző jelenetekben és környezetekben.
- Lehetővé teszi a felhasználók számára a fotók vagy rajzok szerkesztését természetes nyelvű utasítások segítségével.
- Világszintű tudásbázissal rendelkezik, amely az egyszerű vázlatokat oktatási élménnyé alakíthatja.
- Támogatja a több képből álló fúziót, lehetővé téve objektumok áthúzását a képek között.
- Versenyképes árazású, körülbelül 40 dollár 1000 képenként.
- Integrálva lett az Adobe Firefly-ba az OpenAI és a Black Forest Labs modelljei mellé.
Miért fontos?
Tanúi vagyunk a váltásnak a zárt ökoszisztémák felől a modellek „svédasztalos” kínálata felé, ahol az olyan platformok, mint az Adobe, semleges terepként működnek, lehetővé téve az alkotók számára, hogy a konkrét feladathoz legmegfelelőbb eszközt válasszák, ahelyett, hogy egyetlen ökoszisztémába kényszerülnének. ---