MÉLYMERÜLÉS
Az OpenAI kiadta a GPT-5.4 modellt profi szintű feladatteljesítéssel és számítógép-használattal
Az OpenAI megjelentette a GPT-5.4-et, amely integrálja a Codex termékvonal kódolási képességeit egy olyan általános célú modellbe, amely dokumentumokat, táblázatokat és számítógép-használatot is kezel. Ez a kiadás gyakorlatilag bezárja a szakadékot a versenytársakkal, például a Claude-dal szemben, egyetlen modellt biztosítva, amely kódot ír, böngészőkben navigál és prezentációkat készít. Bár az OpenAI lazított a modellen, hogy beszédesebb legyen – ami néha "kaotikus" viselkedéshez, például promptok kiszivárgásához vagy kéretlen funkciók hozzáadásához vezet –, a teljesítménynövekedés jelentős a szakmai összehasonlításokban.
- Az esetek 83%-ában elérte vagy megverte az emberi szakembereket a GDPval szakmai feladatok tesztjein.
- 75%-ot ért el az OSWorld számítógép-használati teszteken, meghaladva a 72,4%-os emberi átlagot.
- A SWE-Bench Pro teszten hozza vagy veri a GPT-5.3-Codex szintjét, miközben gyorsabban fut.
- Első helyen végzett a Vibe Code Bench, a ProofBench és az IOI versenyprogramozási rangsorokon.
- Az ára egymillió bemeneti tokenenként 2,50 dollár, ami a Claude Opus árának fele.
- Az első modell, amely átlépte az 50%-ot az APEX-Agents teszten, ami hatalmas ugrás az egy évvel ezelőtti 5%-hoz képest.
Miért fontos?
Miért fontos: A GPT-5.4 egyszerű chatbotból funkcionális munkatárssá alakítja az AI-t, amely képes operációs rendszerekben navigálni és összetett, professzionális szintű tervezést végezni. ---