MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Google kiadta a Gemini 2.5 Flash „Nano-banana” képgeneráló modellt

A „Nano-banana”, azaz a Gemini 2.5 Flash a Google új natív képgeneráló és -szerkesztő modellje, amely már mindenki számára elérhető a Gemini alkalmazásban és az API-n keresztül. Ez a jelenlegi legjobb képgeneráló modell; rendkívül gyors és olcsóbb, mint a társai. Nagyon kreatívnak tűnik infografikák készítéséhez is. Teszteltem a hírlevél néhány miniatűrjével (thumbnail), ahol korábban a ChatGPT képgenerálásait használtam, vagy meg kellett nyitnom a Pixlr-t. A generálás minősége sokkal jobb, mint a ChatGPT-nél, nincs meg az a műanyag/fényes kinézete vagy az a szépia tónusa, ami a ChatGPT képeire jellemző. Ráadásul az alapvető szöveghozzáadásokat is nagyon jól kezeli. Problémáim adódtak viszont a képarányok módosításával és a kollázsok készítésével.
Miért fontos?

A modell jelentős előrelépést jelent a DALL-E 3-hoz képest, mivel elkerüli a jellegzetes „AI-fényes kinézetet”, miközben nagyobb sebességet, alacsonyabb költségeket és kiválóbb szövegkezelést kínál. ---

Eredeti forrás megtekintése (angol) →