A Siri 2.0 AI-alapú alkalmazásvezérlést tesz lehetővé az Apple LLM-jei révén
Hatalmas változások előtt áll az Apple népszerű hangasszisztense, a Siri, amely a várakozások szerint a közelgő WWDC konferencián egy jelentős, AI-alapú megújuláson esik majd át. A hírek alapján a vállalat célja nem kevesebb, mint az, hogy Siri 2.0 néven egy olyan technológiát mutasson be, amely a fejlett LLM-ek (Large Language Models) erejét felhasználva teszi lehetővé az alkalmazások sokkal mélyebb és komplexebb irányítását. Ez a fejlesztés alapjaiban változtathatja meg azt, ahogyan a felhasználók a hangjukkal kommunikálnak az eszközeikkel, hiszen a rendszer képessé válik az egyes appokon belüli bonyolultabb utasítások megértésére és pontos végrehajtására.
A megújulás középpontjában az áll, hogy az AI a jövőben képes lesz elemezni a felhasználók egyéni szokásait, és ezek alapján proaktívan aktiválhat majd új Siri-parancsokat az Apple saját alkalmazásaiban. Bár a fejlesztés első körben a gyári appokra fókuszál, a tervek szerint a technológiát később kiterjesztik a külső fejlesztők alkalmazásaira is, ami hatalmas lehetőségeket rejt az ökoszisztéma számára. A felhasználók olyan konkrét, eddig bonyolultabb folyamatokat igénylő feladatokat bízhatnak majd a hangasszisztensre, mint például hosszabb cikkek rövid összefoglalása, fényképek gyors szerkesztése és megosztása, vagy éppen az e-mailek kezelése, beleértve azok küldését és törlését is.
A technológiai ugrás ellenére azonban érdemes a helyén kezelni a várakozásokat. A jelenlegi információk szerint a Siri az év szeptemberére tervezett indulásakor még csak az egyedi, különálló parancsok kezelésére lesz képes. A sokkal izgalmasabbnak ígérkező, úgynevezett láncolt, többlépcsős feladatok elvégzése az Apple reményei szerint csak jövőre válhat elérhetővé. Ez a technológiai korlátozottság sokakban kérdéseket vet fel azzal kapcsolatban, hogy az Apple megoldása vajon elég lesz-e ahhoz, hogy valóban kiemelkedő felhasználói élményt nyújtson. Különösen igaz ez akkor, ha összevetjük az OpenAI és a Google által az elmúlt hetekben bemutatott, rendkívül gyors és természetes kommunikációra képes következő generációs hangtechnológiákkal, amelyek mellett a most beharangozott Siri-fejlesztések kissé konzervatívnak vagy akár lemaradónak is tűnhetnek a szakmai közvélemény szemében.
- A megújult Siri a hírek szerint LLM-eket fog használni az eszközön futó alkalmazásokon belüli komplexebb hangutasítások megértéséhez és végrehajtásához.
- Az AI a felhasználói szokásokat is elemezni fogja, hogy automatikusan aktiváljon új Siri-parancsokat az Apple-alkalmazásokban, és a tervek szerint ezt később külső fejlesztők appjaira is kiterjesztik.
- Az új hangutasítási képességek közé tartozik például a cikkek összefoglalása, fotók szerkesztése és megosztása, valamint e-mailek küldése és törlése.
- Bár a Siri a szeptemberre tervezett induláskor még csak egyedi parancsokat fog kezelni, az Apple reményei szerint már jövőre lehetővé válnak a láncolt, többlépcsős feladatok is.
Úgy tűnik, a Siri megkapja a szükséges frissítést, de vajon elég lesz-e ahhoz, hogy valóban hasznos legyen? Mivel a „láncolt” parancsok állítólag csak jövőre érkeznek, a pletykált fejlesztések kissé alulmúlják a várakozásokat – különösen az OpenAI és a Google által az elmúlt hetekben bemutatott következő generációs hangtechnológiákhoz képest. ---