OPENAI
Az OpenAI GPT-5.4 felülmúlja az embereket az asztali navigáció és a munkahelyi benchmarkok terén
Az OpenAI éppen most tette közzé a GPT-5.4-et, a vállalat új csúcsmodelljét, amely jelentős fejlesztéseket hozott az asztali feladatok, a kódolás, a logikai következtetés, a tudomány, a matematika és egyéb területeken – Kevin Weil, a tudományos részleg alelnöke szerint ez az „eddigi legjobb modellünk”.
- Az OAI mindössze két nappal az 5.3 Instant alapértelmezett chatmodellként való bevezetése után adta ki a GPT-5.4-et, amely mostantól GPT-5.4 Thinking néven érhető el a Plus, Team és Pro felhasználók számára.
- A modell 75%-ot ért el az OSWorld-V teszten, amely a valós asztali navigációt vizsgálja – ez 3 ponttal haladja meg a 72,4%-os emberi bázisértéket, és kétszerese annak, amit a GPT-5.2 produkált.
- Az 5.4-es verzió akár 1 millió tokenes kontextusablakot és egy új „x-high” logikai erőfeszítési beállítást is támogat, lehetővé téve az ágensek számára az órákig tartó, összetettebb feladatok megtervezését és végrehajtását.
- A GPT-5.4 az esetek 83%-ában győzött vagy döntetlent ért el szakemberekkel szemben a GDPval teszten, amely egy 44 munkakört lefedő szellemi munka benchmark – ez jelentős előrelépés a GPT-5.2 71%-os eredményéhez képest.
Miért fontos?
Az OpenAI-nak szüksége volt egy sikerre egy nehezebb hét után, és a GPT-5.4 annak tűnik – olyan teljesítménnyel, amely a következő szintre emeli a határokat, különösen az asztali használati esetekben, előremozdítva az ágens-alapú képességeket. A bevezetés mellett Noam Brown, az OAI kutatója egy komoly kijelentést is tett: „Nem látunk falakat”.