MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI 44 munkakörben teszteli az AI-t emberi dolgozók ellen

Az OpenAI most mutatta be a GDPval-t, egy új benchmarkot, amely azt méri, hogy az AI modellek képesek-e megfelelni a professzionális munkaminőségnek 44 foglalkozásban – olyan vezető modelleket tesztelve, mint a GPT-5, Claude Opus 4.1, Gemini 2.5 és Grok 4 iparági szakértőkkel szemben.
Miért fontos?

Az azonnali munkaerő-lecserélésről szóló főcímek ellenére a GDPval azt mutatja, hogy még a legjobb modellek is csak most érik el a szakemberekkel való egyenlő szintet bizonyos feladatokban. De ha ez a benchmark hasonló az AI világ más benchmarkjaihoz, akkor nem sok idő múlva a fejlettebb modellek jelentős ugrást tesznek, mindössze néhány hónapos gyorsulással. ---

Eredeti forrás megtekintése (angol) →