MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI bemutatta a GPT-4o multimodális modellt valós idejű interaktivitással

Az OpenAI bemutatta a GPT-4o-t, egy élvonalbeli multimodális modellt, amely szöveget, látványt és hangot is feldolgoz, a GPT-4 Turbo-hoz képest kiváló sebességet és költséghatékonyságot kínálva. Az új hangasszisztens valós idejű fordítást, arckifejezés-olvasást és dinamikus hangadaptációt kínál, jelentősen javítva az interaktivitást. Az OpenAI bővítette az ingyenes csomagot, elérhetővé téve a korábban csak ChatGPT Plus felhasználók számára fenntartott funkciókat és a korlátozott hozzáférést a GPT-4o-hoz. Emellett bejelentettek egy új asztali alkalmazást Mac-re, amelynek Windows-os verziója hamarosan érkezik, és az Apple eszközeivel való integráció is a láthatáron van.
Miért fontos?

A modell képessége, hogy a hangot, látványt és szöveget egyetlen neurális hálózatban kezelje, csökkenti a késleltetést és emberibb, érzelmesebb interakciót tesz lehetővé, ami hatalmas ugrást jelent a konverzációs AI területén. ---

Eredeti forrás megtekintése (angol) →