AI KUTATÁS
Az Apple bemutatta az MGIE AI-modellt utasításalapú képszerkesztéshez
Az Apple és az UC Santa Barbara kutatói nemrég tették közzé az MGIE-t, egy open-source AI-rendszert, amely természetes nyelvű utasításokkal szerkeszt képeket.
- Az MGIE multimodális nagy nyelvi modelleket (MLLM) használ az utasítások értelmezéséhez és a szerkesztések irányításához.
- A modell képes olyan feladatok elvégzésére, mint a színek vagy objektumok módosítása, a fényerő/kontraszt optimalizálása, vagy szűrők alkalmazása egyszerű szöveges utasítások alapján.
- A modell end-to-end tanítást kapott, így a szerkesztések összhangban vannak az utasításokkal, miközben megőrzik a nem érintett területeket.
Miért fontos?
Az Apple mostanában rákapcsolt az AI-kutatásokra – és ez az open-source modell különösen ígéretes. Míg a piacvezető szöveg-kép generátorok már rendelkeznek inpainting és kijelölésalapú szerkesztő funkciókkal, az MGIE utasításalapú szerkesztése végül elhozhatja a Photoshop-szintű irányítást egyszerű szöveges parancsokkal. ---