MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Google elindította a fejlett karakterkonzisztenciával rendelkező Gemini 2.5 Flash Image-et

A Google kiadta régóta várt új képmodelljét, amely a „nano-banana” kódnevet viseli, hivatalos neve pedig Gemini 2.5 Flash Image. Ez a modell az AI képgenerálás egy régóta fennálló kihívására ad választ: a karakterek hasonlóságának megőrzésére a különböző képeken. A felhasználók mostantól ugyanazt a karaktert helyezhetik el különféle környezetekben – például sivatagban, víz alatt vagy diszkóban –, és a vizuális megjelenésük konzisztens marad. A modell jelenleg ingyenesen kipróbálható az AI Studio felületén. A kiadás olyan speciális sablonokat is tartalmaz, mint a PixShop a fotószerkesztéshez, a Co-drawing a vázlatok javításához és a Home Canvas több kép zökkenőmentes egyesítéséhez. Képenkénti 0,039 dolláros árával rendkívül megfizethető professzionális eszközként pozicionálják, és már integrálták olyan platformokba, mint az OpenRouter, a fal.ai és az Adobe Firefly.

Miért fontos?

Tanúi vagyunk a váltásnak a zárt ökoszisztémák felől a modellek „svédasztalos” kínálata felé, ahol az olyan platformok, mint az Adobe, semleges terepként működnek, lehetővé téve az alkotók számára, hogy a konkrét feladathoz legmegfelelőbb eszközt válasszák, ahelyett, hogy egyetlen ökoszisztémába kényszerülnének. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Midjourney v6 új mérföldkőhöz érkezett a realizmus terén 200 millió dolláros bevétel mellett
2024. január 4.
A Mondo Robotics bemutatta Benit, az autonóm kamerarobotot tartalomgyártók számára
4 órája
A Booster Robotics humanoidja falat is átütő rúgással debütált a futballbemutatón
7 órája
Tudj meg többet
Midjourney: AI képgenerálás útmutató magyarul
Gemini a Gmail-ben és a Google Docs-ban: Így automatizáld a munkád