MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Stability AI bemutatja a Stable Diffusion 3-at továbbfejlesztett tipográfiával

A Stability AI a napokban hivatalosan is bemutatta a Stable Diffusion 3-at, a vállalat népszerű képgeneráló modelljének legújabb, jelentős technológiai ugrást ígérő iterációját. A fejlesztés középpontjában a generált képek minőségének javítása, a több objektumot tartalmazó komplex kompozíciók pontosabb megjelenítése, valamint az AI-képgenerálás egyik klasszikus Achilles-sarka, a szövegek és tipográfia kezelésének mesteri szintű megoldása áll. A frissített modell jelenleg egy korai előzetes, azaz early preview verzióban érhető el, amelyhez a felhasználók egy várólistán keresztül kaphatnak hozzáférést, ezzel is biztosítva a kontrollált tesztelési fázist a szélesebb körű publikáció előtt.

A modell technikai hátterét egy alapjaiban megújított, úgynevezett transformer architektúra biztosítja, amely működésében az OpenAI Sora-jához hasonló elveken alapul. Ez az innovatív megközelítés drasztikusan javítja a rendszer teljesítményét és az előállított képek vizuális minőségét. A rugalmasság jegyében a Stability AI többféle modellméretet kínál a felhasználóknak: a skála a 800 millió paraméteres, könnyebben futtatható verziótól egészen a 8 milliárd paraméteres, nagy teljesítményű óriásmodellig terjed. Ez a sokszínűség lehetővé teszi, hogy a különböző hardverkapacitással rendelkező fejlesztők és kreatív szakemberek is megtalálják a számukra legoptimálisabb megoldást, miközben a továbbfejlesztett tipográfiai motor immár képes hosszú, helyesírási hibáktól mentes mondatokat is megjeleníteni a képeken belül.

Ez a bejelentés azért bír kiemelt jelentőséggel az iparág számára, mert újabb bizonyítékát adja annak, hogy az open-source közösség és a mögötte álló fejlesztők lépésről lépésre zárkóznak fel a piaci dominanciával rendelkező, zárt AI-megoldásokhoz. A múltban a nyílt forráskódú modellek és a legfejlettebb, zárt rendszerek között tátongó szakadék sok esetben jelentős volt, ám a Stable Diffusion 3 érkezése egyértelműen jelzi, hogy a nyílt fejlesztések már nem csupán alternatívát, hanem érdemi versenytársat jelentenek a nagy tech-óriásoknak. A szöveges promptok precíz lekövetése és a komplex tipográfiai képességek olyan mérföldkövet jelentenek, amelyet még a piacvezetők, mint a Midjourney vagy az OpenAI megoldásai sem tudtak korábban tökéletesen megoldani. A Stable Diffusion 3 megjelenése tovább gyorsítja az AI-képgenerálás evolúcióját, új távlatokat nyitva a tartalomgyártás és a digitális művészet területén.

Miért fontos?

Bár a múltban nagy szakadék tátongott a nyílt modellek és a piacvezető zárt AI-k között, egyre világosabbá válik, hogy az open-source felveheti a versenyt a legjobbakkal. Ez a frissítés folytatja az AI-képgenerálás felgyorsulását – olyan lenyűgöző szöveges készségekkel, amelyeket még a Midjourney és az OpenAI sem tudott teljesen megoldani. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Új vezetést és pénzügyi mentőövet kap a Stability AI
2026. május 23.
A Stability AI elindította a Stable Audio-t AI-generált zenékhez és hangokhoz
2023. szeptember 14.
A Stability AI kiadta az SDXL 1.0-t, a Midjourney-vel vetekedő nyílt képalkotó modellt
2023. július 27.