MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI érvelési képességének fejlesztése hangügynökök számára

Az OpenAI bemutatta a GPT-Realtime-2, GPT-Realtime-Translate és GPT-Realtime-Whisper modelleket, amelyek három API hangmodell, és új érvelési, streaming, eszközhasználati, realisztikus és további képességfejlesztéseket hoznak az AI hangügynökök és az élő beszéd számára.

Miért fontos?

Úgy tűnik, hogy az AI hangügynökök körökre osztott korszaka a végéhez közeledik, mivel az OAI új modellje olyan rendszerek felé mozdul el, amelyek jobban képesek érvelni, eszközöket használni és munkafolyamatokat befejezni anélkül, hogy kellemetlen megszakítások kizökkentenék a felhasználókat a természetes áramlásból. Az AI iparág a szöveges ügynökökre fókuszál, de a következő hullámot beszéddel fogjuk irányítani, nem gépeléssel. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
NYT-újságíró AI segítségével, ingatlanügynök nélkül adta el házát
most
Az Anthropic megerősítette, hogy a nagyteljesítményű Mythos modell hamarosan elérhető lesz a nyilvánosság számára
most
Az ElevenLabs Music v2 lehetővé teszi a szám közbeni műfajváltást és a gyors repet
most
Tudj meg többet
OpenAI Sora: AI videógenerálás – minden, amit tudni kell
OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép