LUMA LABS
A Luma AI bemutatta az Uni-1 képgeneráló modellt egységesített gondolkodási folyamattal
A Luma AI bevezette az Uni-1-et, egy olyan képgeneráló modellt, amely a szöveget és a látványt ugyanazon a folyamaton keresztül dolgozza fel – átgondolva a kért feladatot az alkotás előtt és közben is; a cég ezt a megközelítést az „általános intelligenciához vezető útnak” nevezi.
- Az Uni-1 ugyanarra az architektúrára épül, mint a GPT Image 1.5 és a Nano Banana Pro, a szöveget és a képeket egyetlen folyamatban dolgozza fel a diffúziós eljárás helyett.
- A modell valós világbeli megértéssel is rendelkezik, ami lehetővé teszi a kreatív döntéseket és olyan felhasználási eseteket, mint az infografikák, mangák és specifikus esztétikai megoldások.
- A tesztek során az Uni-1 végzett a stílus, a szerkesztés és a referencia-alapú munka emberi preferencialistáinak élén, a szöveg-kép alapú ELO rangsorban pedig csak a Nano Banana Pro mögött maradt el.
- Az Uni-1 API ára 2K felbontásnál ~0,09 dollár/kép, ami nagyjából egyharmaddal alacsonyabb a Nano Banana Pro 0,134 dolláros áránál, bár az API egyelőre csak várólistáról érhető el.
Miért fontos?
A Luma a videókkal szerzett hírnevet, így egy képgeneráló modell új irányt jelent. Ha ugyanez a rendszer kiterjeszthető a videókra, hangra és interaktív világokra, ahogy azt a Luma sejteti, az Uni-1 alapja lehet egy olyan modellnek, amely kreatívan mindenre képes – belépve a kreatív ágensek területére, amit a felhasználók már elvárnak. ---