OPENAI DEVDAY
Exkluzív DevDay interjú az OpenAI termékvezetőjével, Olivier Godement-nel
A keddi DevDay esemény után beszéltünk Olivier Godement-nel, az OpenAI termékvezetőjével az új Realtime API-ról (a válaszokat a tömörség kedvéért összefoglaltuk).
- A Realtime API-ról: Godement szerint eddig a hang alapú interakció csak másodlagos tevékenység volt, de a Realtime API jelentősen hozzáférhetőbbé teszi az AI-t, mivel a való világban sokan jobban szeretnek beszélni, mint olvasni vagy gépelni.
- A valós felhasználási esetekről: Godement úgy véli, a Realtime API egyértelmű áttörést hoz az ügyfélszolgálat, az oktatás és a coaching területén, de számos ma még nehezen megjósolható alkalmazási mód is várható.
- Az árazásról: Másodpercekre átszámítva az audio input kb. 6 cent, az output pedig kb. 24 cent percenként. Bár ez jelenleg magas, Godement megerősítette, hogy jelentős árcsökkentések szerepelnek az ütemtervben.
- A Twitteren keringő félreértésekről: Godement megemlítette az árazás félreértelmezését – sokan úgy számolták az óránkénti költséget, mintha folyamatos lenne a beszéd. Azonban az emberi beszéd során sok a csend, és a modell a csendért nem számít fel díjat.
- A jövőbeli modalitásokról: Egyelőre a Realtime API csak szöveget és hangot támogat. Godement szerint a kép és a videó a következő mérföldkő az emberi módon érzékelő ágensek felé vezető úton. Kiemelte, hogy a képi és videós elemzés különösen az ügyfélszolgálatot fogja felpörgetni, amikor a modell képes lesz valós időben értelmezni a képernyőn látható pixeleket.
- --