A Google elindítja a Gemini Live-ot, hogy versenybe szálljon az OpenAI hangmódjával
Az Alphabet hivatalosan is elindította a Gemini Live szolgáltatást, amely közvetlen riválisként hívja ki az OpenAI sokat emlegetett hangmódját. Az új funkció első körben a Gemini Advanced felhasználók számára válik elérhetővé az Android platformon. Bár az OpenAI már májusban bemutatta a saját élethű hangfunkcióit, a Google-nek végül sikerült megelőznie a versenytársát a szélesebb körű lakossági bevezetéssel. A legelső felhasználói visszajelzések rendkívül pozitívak, a legtöbb korai tesztelőt ugyanis valósággal lenyűgözték a bot társalgási képességei, amelyek egy egészen új szintre emelik az ember és az AI közötti interakciót.
A Gemini Live használata során a felhasználók leginkább a minimális késleltetést és a természetes folyamatosságot emelték ki. A rendszer egyik legnagyobb fejlesztési bravúrja, hogy lehetővé teszi a beszélgetés közbeni megszakítást. Ez azt jelenti, hogy a felhasználóknak nem kell végighallgatniuk a bot teljes válaszát, hanem mondat közben is félbe lehet szakítani a programot, hogy új irányt szabjanak a társalgásnak, pontosan úgy, mint egy hús-vér emberrel való csevegés során. Bár a szoftver jelenleg még nem képes a mobileszköz valós, rendszerszintű funkcióival interakcióba lépni – így például nem alkalmas arra, hogy ébresztőket állítson be –, a figyelemre méltóan emberi hangzása miatt kiválóan használható kötetlen ötletelésre vagy akár egy éles interjúfelkészítésre is. A Google ígérete szerint ráadásul az iOS verzió is hamarosan megérkezik.
Ez a technológiai mérföldkő azonban sokkal mélyebb társadalmi kérdéseket is felvet, mint az egyszerű funkcionális kényelem. A legújabb generációs hangalapú botok ugyanis láthatóan annyira meggyőzően és élethűen kommunikálnak, hogy a felhasználók közül egyesek már nem csupán egy digitális eszközként, hanem valódi társként tekintenek rájuk. Maga az OpenAI is beszámolt egy jelentésében arról a tendenciáról, hogy néhány felhasználó kifejezett érzelmi kötődést alakított ki a hangalapú bottal. Ez a jelenség alapjaiban és korábban teljesen ismeretlen módon változtathatja meg a jövőben a hagyományos emberi kapcsolatokat és a megszokott társadalmi dinamikát, miközben a technológiai óriások közötti verseny egyre inkább az emberi jelenlét tökéletes szimulációjára helyeződik át.
- A Gemini Live elérhetővé válik a Gemini Advanced felhasználók számára Androidon, az iOS verzió pedig hamarosan érkezik.
- A felhasználói visszajelzések szerint képzett beszélgetőpartner, minimális késleltetéssel.
- Lehetővé teszi a felhasználók számára, hogy mondat közben szakítsák félbe a botot a beszélgetés átirányítása érdekében.
- Jelenleg nem képes interakcióba lépni az eszköz valós funkcióival, például az ébresztőkkel.
Miért fontos: A legújabb hangalapú botok láthatóan annyira meggyőzőek, hogy egyesek már társként tekintenek rájuk. Az OpenAI jelentése szerint néhány felhasználó érzelmi kötődést alakított ki a hangalapú bottal, ami korábban ismeretlen módon változtathatja meg a társadalmi dinamikát.