Elképesztő ChatGPT-4o Vision és Voice demók leleplezve
Vannak, akik Lambókról álmodoznak, ha nagyot kaszálnak. Én? Én azokról az epikus dolgokról álmodozom, amiket a ChatGPT-4-gyel fogok megvalósítani, amikor a vision és Voice Mode funkciói végre elérhetővé válnak. Ezek megjelenési dátuma még TBD. Állítólag júniusra tervezték, de az OpenAI további biztonsági teszteket végez. Valószínűleg még ebben a hónapban, de ki tudja ezekkel az AI varázslókkal. Mindegy, ezen a héten még jobban nyáladzunk ezen a modellen, köszönhetően a csapat által kiadott lenyűgöző demóknak. Először is, a hangos dolgok az OpenAI YouTube csatornájáról: Ezek a demók semmihez sem hasonlíthatók, amit eddig láttunk. De a vision képességek azok, amik igazán izgalommal töltenek el minket. Romain Huet, az OpenAI fejlesztői evangelistája mutatta be ezeket a képességeket az AI Engineer's World Fair-en a múlt héten, és te jó ég:
- Különböző karakterhangok létrehozása GPT-4 voice-zal.
- Szerepjátékos interjú a GPT-4-gyel, amely "látja" az interjúztatót.
- ChatGPT használata nyelvi tanárként a portugál gyakorlásához.
- Egy fizikai könyv egy oldalának összefoglalása egy másodperc alatt, csak rápillantva.
- Képek vázlatainak megértése – óvodáskori rajztudásod végre hasznos lehet!
- Segített Romain-nek kijavítani egy elrontott dizájnt azáltal, hogy a képernyőjére nézett és menet közben finomította a kódot.
Miért fontos?
Ez az utolsó pont az, amiért ez fontos. Hamarosan rendelkezhetünk egy AI-val, amely 24/7 látja, amit mi látunk a számítógépünk képernyőjén. Nincs többé küzdelem azzal, hogy leírjuk, mit látunk, vagy millió screenshotot küldözgetünk. Valós idejű AI asszisztens lesz minden vizuális feladatunkhoz. ---