GOOGLE
A Google Gemini 2.5 Flash Image modellje új szintre emeli az AI-alapú szerkesztést
A Google megjelentette a Gemini Flash 2.5 Image (a tesztek során „nano-banana”) modellt, egy új AI-t, amely precíz, többlépcsős képszerkesztésre képes, megőrizve a karakterhűséget, miközben nagyobb kreatív kontrollt ad a felhasználóknak.
- A modell „nano-banana” néven vírusként terjedt a tesztelés alatt, és hatalmas előnnyel az első helyre került az LM Arena képszerkesztési ranglistáján a második Flux-Kontext előtt.
- A Flash 2.5 Image támogatja a többfordulós szerkesztést, lehetővé téve a felhasználók számára a módosítások rétegzését, miközben fenntartja a konzisztenciát a folyamat során.
- A modell képes képek összeolvasztására, stílusok alkalmazására és keverésére jeleneteken és tárgyakon keresztül, mindezt természetes nyelvi utasítások alapján.
- Multimodális következtetést és világismeretet is használ, így stratégiai döntéseket hoz (például a környezethez illő növényeket ad hozzá) a folyamat során.
- A modell ára 0,039 dollár képenként az API-n és a Google AI Studio-n keresztül, ami valamivel olcsóbb, mint az OpenAI gpt-image és a BFL Flux-Kontext modelljei.
Miért fontos?
Az AI még nem áll készen a Photoshop-stílusú munkafolyamatok teljes kiváltására, de a Google új modellje egy lépéssel közelebb visz a hagyományos szerkesztés leváltásához. A karakterek konzisztenciájának és a kép megőrzésének magas szintje miatt a Flash Image AI egyfajta „Studio Ghibli-stílusú” fellendülést hozhat a Gemini számára, és újabb vírusszerűen terjedő alkalmazások hullámát indíthatja el.