Az OpenAI bemutatta az új, beszélő AI-modelljét, a GPT-4o-t
Az OpenAI az utolsó pillanatig bizonytalanságban tartott minket. Hétfőn a vállalat végre megmutatta az AI következő nagy dobását: nem a GPT-5-öt, hanem egy GPT-4o nevű új modellt, amely kicsit más, mint amire a legtöbb szakértő számított – de nem kevésbé izgalmas. Mi különbözteti meg a többitől? Gyorsabb és hatékonyabb, de a legnagyobb változást talán a könnyű kezelhetősége jelenti. A hírek szerint intuitívabb, mint egy „mindenes”, amely könnyedén vált a különböző médiumok, például a hang, a szöveg és a képek között – olyasmi, mint a ChatGPT továbbfejlesztett változata, keresztezve egy szuperképességű Sirivel. Az OpenAI szerint a GPT-4o kétszer gyorsabb és 50%-kal olcsóbb, mint a GPT-4 Turbo, amely a tegnapi bejelentésig a legfejlettebb modelljük volt. A cég azt is állítja, hogy a modell több kulcsfontosságú benchmarkon, például az ELO rangsorolási rendszerben is jelentős különbséggel veri a versenytársakat. A legfontosabb tanulság: a GPT-4o hátborzongatóan jól utánozza az emberi kommunikáció sajátosságait. Például, ha témát akarunk váltani, egyszerűen félbeszakíthatjuk a mondat közepén, és továbbléphetünk valami másra. Az emberi érzelmek – beleértve a beszédhang tónusát, a légzési mintákat és az arckifejezéseket – felismerésére való képessége hatalmas előrelépést jelent. A legtöbb felhasználó számára a GPT-4o ingyenesen elérhetővé válik a következő hetekben. Az OpenAI egy alkalmazást is kiad, így a felhasználók közvetlenül az asztali számítógépükön is használhatják. De a feltételezett Google Search versenytársról még mindig nincs hír... egyelőre.
- Egy olasz és egy angol anyanyelvű beszélő segítése valós idejű fordítóként
- Végigvezetett egy előadót egy papírra írt matematikai egyenlet megoldásán
- Egy kóddal teli weboldal elemzése, majd az időjárási mintázatok leírása egy átlaghőmérsékleti grafikon alapján
- Különböző stílusokban való kommunikáció, a hiper-expresszívtől az éneklősön át a robotikusig
- --