KIEMELT HÍREK
Az Apple bemutatja a Ferret-UI 2-t az automatizált mobil- és webes feladatvégrehajtáshoz
Az Apple kifejlesztette és nyíltan közzétette a Ferret-UI 2-t, egy multimodális nagy nyelvi modellt, amelyet kifejezetten a mobil eszközökön és webböngészőkön keresztüli feladatok automatizálására terveztek. A modellt a felhasználói felületek megértésére és az azokkal való interakcióra optimalizálták, különösen az iPhone-okon található nagy felbontású képernyőkhöz.
- Nyílt forráskódúvá tettek egy multimodális nagy nyelvi modellt (MLLM), amelyet a felhasználói felület (UI) megértésére szabtak
- A mobil és webes környezetek vizuális elemeinek feldolgozására és értelmezésére tervezték
- Az AI ágensek azon képességének javítására összpontosít, hogy autonóm módon navigáljanak és kommunikáljanak az alkalmazásokkal
- Nagy felbontású UI-képernyőfotók feldolgozására és az elemek felismerésére optimalizálták
Miért fontos?
Ahogy az Apple egyre mélyebben integrálja az AI-t az ökoszisztémájába, az olyan eszközök, mint a Ferret-UI, biztosítják azokat az alapvető érvelési képességeket, amelyek a felhasználók nevében az alkalmazásokban navigálni képes, fejlett autonóm ágensekhez szükségesek. ---