ALIBABA
Az Alibaba elindította a Qwen-Image-Editet, egy 20 milliárd paraméteres, open-source képszerkesztőt
Az Alibaba Qwen-csapata kiadta a Qwen-Image-Edit modellt, amely egy 20 milliárd paraméteres, open-source képszerkesztő. A modell képes a pixelpontos szerkesztésekre és stílusátalakításokra is, miközben érintetlenül hagyja az eredeti karaktereket és tárgyakat.
- A Qwen-Image-Edit két irányba bontja a szerkesztést: olyan változtatásokra, mint a tárgyak elforgatása vagy a stílusátvitel, illetve az egyes területek szerkesztésére, miközben minden mást sértetlenül hagy.
- A beépített kétnyelvű képességek lehetővé teszik a felhasználók számára, hogy közvetlenül a képeken módosítsák a kínai és angol szövegeket anélkül, hogy elrontanák a már meglévő betűtípusokat, méreteket vagy formázási beállításokat.
- Több szerkesztés is egymásra építhető, így a felhasználók darabonként javíthatják a bonyolult képeket, ahelyett, hogy minden alkalommal újrakezdenék.
- A modell SOTA teljesítményt ér el számos kép- és szerkesztési benchmarkon, megelőzve az olyan riválisokat, mint a Seedream, a GPT Image és a FLUX.
Miért fontos?
A képgenerálás képességei robbanásszerűen fejlődtek, de az első igazán erős AI-szerkesztőeszközök csak most kezdenek megjelenni. A Qwen Image-Edit open-source közzétételével és az LM Arenában jelenleg nagy port kavaró „nano-banana” modellel úgy tűnik, a részletes, természetes nyelven alapuló szerkesztési lehetőségek küszöbön állnak.