MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Elképesztő ChatGPT-4o Vision és Voice demók leleplezve

Vannak, akik Lambókról álmodoznak, ha nagyot kaszálnak. Én? Én azokról az epikus dolgokról álmodozom, amiket a ChatGPT-4-gyel fogok megvalósítani, amikor a vision és Voice Mode funkciói végre elérhetővé válnak. Ezek megjelenési dátuma még TBD. Állítólag júniusra tervezték, de az OpenAI további biztonsági teszteket végez. Valószínűleg még ebben a hónapban, de ki tudja ezekkel az AI varázslókkal. Mindegy, ezen a héten még jobban nyáladzunk ezen a modellen, köszönhetően a csapat által kiadott lenyűgöző demóknak. Először is, a hangos dolgok az OpenAI YouTube csatornájáról: Ezek a demók semmihez sem hasonlíthatók, amit eddig láttunk. De a vision képességek azok, amik igazán izgalommal töltenek el minket. Romain Huet, az OpenAI fejlesztői evangelistája mutatta be ezeket a képességeket az AI Engineer's World Fair-en a múlt héten, és te jó ég:
Miért fontos?

Ez az utolsó pont az, amiért ez fontos. Hamarosan rendelkezhetünk egy AI-val, amely 24/7 látja, amit mi látunk a számítógépünk képernyőjén. Nincs többé küzdelem azzal, hogy leírjuk, mit látunk, vagy millió screenshotot küldözgetünk. Valós idejű AI asszisztens lesz minden vizuális feladatunkhoz. ---

Eredeti forrás megtekintése (angol) →