AI ESZKÖZÖK
Feladatok funkcióval bővült a ChatGPT, miközben az AI az ágens-képességek felé mozdul el
Az OpenAI csendben kiadta első „ágens-közeli” funkcióját: a Tasks-ot (Feladatok). Ez alapvetően egy teendőlista, amely képes jövőbeli akciók ütemezésére – gondoljunk heti hírek összefoglalójára, napi edzéstervre, vagy csak emlékeztetőre, hogy hívjuk fel anyukánkat jövő kedden. Nem az OpenAI az egyetlen, amely „asszisztens-szerűbbé” teszi az AI-t. Tavaly év végén a Google elindította az Agentspace-t, egy platformot, amely lehetővé teszi a vállalatok számára saját AI ágensek építését. Az alapvető chatbotokkal ellentétben ezek az ágensek képesek a vállalat teljes adatökoszisztémájában (e-mail, dokumentumok, Jira stb.), valamint az interneten is valós időben keresni. Már elindították a specializált verziókat a kiskereskedelem számára, segítve az üzleteknek a készletkezelést és az ügyfélszolgálatot az AI segítségével.
Az Amazon titokban az Alexa újjáépítésén dolgozik, hogy a ChatGPT-hez hasonlóbb legyen, bár a projektet késleltetik a hallucinációk minimalizálására tett erőfeszítések. A közelmúltbeli iparági adatok szerint a Google Gemini Flash vezet 1,3%-os hallucinációs rátával, míg a GPT-4 1,5-1,8%-kal követi. Azonban a pontosság zuhanhat, ha nem kapcsolódó kontextus kerül a lekérdezésbe, ami rávilágít az AI kritikus rendszerekbe való elhamarkodott integrálásának kockázataira.
- A Tasks elérhető a Plus, Pro és Teams felhasználók számára, a szélesebb körű hozzáférés hamarosan várható.
- A Google Agentspace lehetővé teszi az ágensek számára a belső vállalati adatok és a web egyidejű keresését.
- Az Amazon két évet töltött az Alexa újjáépítésével, hogy szinte nulla hibával kezelje a harmadik féltől származó integrációkat.
- Jelenleg a Gemini Flash rendelkezik a legalacsonyabb hallucinációs rátával (1,3%).
- Anj Simmons kutató megállapította, hogy a GPT-4 pontossága 99,3%-ról 32,1%-ra esett vissza, amikor nem kapcsolódó kontextust adtak a lekérdezéshez.
Miért fontos?
Ez minden eddiginél fontosabb, mivel az AI a „csevegőpartner” szerepéből az „életünket irányító” eszköz felé mozdul el. A legnagyobb AI-kockázat jelenleg nem egy szuperintelligens hatalomátvétel, hanem ezen rendszerek elkapkodott integrálása a kritikus személyes és szakmai munkafolyamatokba, mielőtt a hallucinációs ráták kellően alacsonyak lennének. ---