MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI kiadta a GPT-Realtime modellt és a Realtime API-t a természetes beszélgetésekhez

Hónapokig tartó béta fázis után az OpenAI hivatalosan is elindította fejlett gpt-realtime hangmodelljét és a Realtime API-t. Ez a rendszer képes érzelmeket váltani, hangszínt módosítani és nyelvet váltani mondat közben a természetesebb hatás érdekében. A régebbi megoldásokkal ellentétben, amelyek külön modelleket kapcsoltak össze a beszédhez és a szöveghez, a gpt-realtime mindent egyetlen modellen keresztül futtat, ami csökkenti a késleltetést és javítja a folyamatosságot. Az API MCP szerver támogatással, képbeviteli lehetőséggel és SIP telefonhívás-támogatással is rendelkezik, több eszközt adva a fejlesztőknek a válaszkész hangalapú ágensek építéséhez.

Miért fontos?

A régebbi megoldásokkal ellentétben, amelyek külön modelleket kapcsoltak össze a beszédhez és a szöveghez, a gpt-realtime mindent egyetlen modellen keresztül futtat, ami csökkenti a késleltetést és javítja a beszélgetés áramlását. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Az xAI elindította a Grok Imagine Video 1.5-öt továbbfejlesztett fizikával
6 órája
A Vercel és az Astro alkotói versengő ágens-keretrendszereket indítottak
6 órája
Kiszivárogtak az OpenAI pénzügyi adatai, Noam Shazeer pedig a Google-től csatlakozik a céghez
6 órája
Tudj meg többet
OpenAI Sora: AI videógenerálás – minden, amit tudni kell
OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép