A Sakana AI bemutatta az EvoSDXL-JP-t a japán stílusú képgeneráláshoz

2026. május 23. · MI Történik? · 2 perc olvasás

A Sakana AI nevű tech startup hivatalosan is bemutatta a legújabb fejlesztését, az EvoSDXL-JP nevet viselő modellt, amelyet kifejezetten a japán stílusú képek generálására terveztek. Ez a rendkívül gyors text-to-image generátor egy komoly mérföldkövet jelent a vállalat életében, ugyanis ezzel a lépéssel sikeresen kiterjesztették a saját fejlesztésű evolutionary model merging technikájukat a nagynyelvi modellek világán túlra is. Az új eszköz nemcsak technológiai szempontból izgalmas, hanem kiemelten fontos szerepet játszhat abban is, hogy a generatív AI megoldások szélesebb körben is elérhetővé és hatékonyan használhatóvá váljanak a japán piacon.

A modell felépítése és működése hűen tükrözi a startup innovatív megközelítését. Az EvoSDXL-JP létrehozása során a fejlesztők egy kifejezetten japán és egy angol nyelvű képmodellt olvasztottak össze, a kapott eredményt pedig egy még gyorsabb diffúziós modellel kombinálták. Ennek a technológiai ötvözetnek köszönhetően a rendszer elképesztő, mintegy tízszeres sebességnövekedést mutat a korábbi megoldásokhoz képest. A Sakana AI egyedülálló modell-összeolvasztási eljárása lényegében a természetes szelekciót utánozza a digitális térben. A folyamat során modellek százait tenyésztik ki, majd a különböző teljesítményalapú teszteken legjobban szereplő verziók válnak a következő generáció szülőivé, biztosítva a folyamatos fejlődést és a hatékonyságot.

Az elkészült modell teljes mértékben támogatja a japán nyelvű promptok bevitelét, így a felhasználók közvetlenül a saját anyanyelvükön adhatnak pontos utasításokat a mesterséges intelligenciának. Az EvoSDXL-JP képes mélyen értelmezni a helyi kulturális sajátosságokat, és ennek megfelelően kulturálisan releváns, hiteles vizuális tartalmakat generálni. A fejlesztés igazi jelentősége és nóvuma abban rejlik, hogy míg a Sakana AI különleges evolutionary model merging eljárása korábban csak az LLM modellek tökéletesítésében és fejlesztésében mutatott fel egyedülálló sikereket, mostanra világossá vált, hogy ugyanez a folyamat a képgenerálás minőségének és sebességének fokozására is maximálisan alkalmazható.

Az EvoSDXL-JP egy japán és egy angol képmodell összeolvasztásával készült, majd az eredményt egy gyorsabb diffúziós modellel kombinálták a 10-szeres sebességnövekedés érdekében.
A Sakana modell-összeolvasztási eljárása modellek százainak „tenyésztését” foglalja magában, ahol a legsikeresebbek lesznek a következő generáció „szülői”.
A modell támogatja a japán nyelvű promptokat, és kulturálisan releváns képeket képes generálni, azzal a céllal, hogy elérhetőbbé tegye a genAI-t az országban.

Miért fontos?

A Sakana „evolutionary model merging” technikája már korábban is egyedülálló módszereket mutatott az LLM-ek fejlesztésére – az EvoSDXL-JP pedig most bebizonyítja, hogy ugyanez a folyamat a képgenerálás fokozására is alkalmazható. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Sakana AI szerint megszületett az első teljesen AI által írt tudományos dolgozat, amely átment a szakmai bírálaton

2026. május 24.

A GPT-5 lett az első AI modell, amely képes megfejteni egy teljes 9x9-es Sudoku-t

2025. november 11.

A Sakana AI bemutatja az AB-MCTS algoritmust a modellek együttműködéséhez

2025. július 3.