MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A ChatGPT Advanced Voice Mode valós idejű látási képességekkel bővült

Az OpenAI élő közvetítéssorozatának 6. napján jelentős frissítést mutatott be a ChatGPT Advanced Voice Mode-hoz, amely lehetővé teszi az AI számára, hogy elemezze az élő videóbemenetet és a képernyőmegosztást, majd reagáljon is azokra a beszélgetés során.
Miért fontos?

Hét hónappal az első demó után az OpenAI végre beváltja az ígéretét a társalgási AI vizuális értelmezésével kapcsolatban – a ChatGPT-t a szövegen és hangon túl a valódi multimodális interakció irányába mozdítva el. Ez egy fontos hét volt a látás (vision) szempontjából, hiszen a Gemini és a ChatGPT Advanced Voice is rendívül erőteljes új képességekkel gazdagodott. ---

Eredeti forrás megtekintése (angol) →