AI MODELLEK
Az OpenAI kiadta a GPT-Realtime modellt és frissítette az API-t
Az OpenAI bemutatta a gpt-realtime-ot, egy új, kifejezetten fejlesztőknek szánt speech-to-speech modellt. Az új modellel együtt a Realtime API is frissült: támogatja a Model Context Protocol (MCP) használatát és a képbevitelt, így a fejlesztők teljes eszköztárat kapnak hosszú hang- és videóalapú csevegések létrehozásához. Bár a technológia fejlődik, az árazás továbbra is akadályt jelent az alacsony költségvetésű lakossági alkalmazások számára.
- A gpt-realtime ára 20%-kal alacsonyabb a standard gpt-4o realtime díjainál.
- A bemeneti költség 32 dollár egymillió audio tokenenként, míg a kimeneti költség 64 dollár egymillió tokenenként.
- A jelenlegi árazás nagyjából 1 dollárt jelent minden 15 perc aktív csevegés után.
- A modell támogatja a képbevitelt és az MCP-t, lehetővé téve az összetettebb ágens-munkafolyamatokat az élő munkamenetek során.
Miért fontos?
A képfelismerés és az MCP hozzáadása a Realtime API-hoz lehetővé teszi a fejlesztők számára, hogy sokkal kifinomultabb, „látó és halló” ágenseket építsenek, bár a magas percenkénti költség miatt ez továbbra is a prémium vagy vállalati felhasználási módokat célozza meg.