MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI 44 munkakörben teszteli az AI-t emberi dolgozók ellen

Az OpenAI most mutatta be a GDPval-t, egy új benchmarkot, amely azt méri, hogy az AI modellek képesek-e megfelelni a professzionális munkaminőségnek 44 foglalkozásban – olyan vezető modelleket tesztelve, mint a GPT-5, Claude Opus 4.1, Gemini 2.5 és Grok 4 iparági szakértőkkel szemben.

Miért fontos?

Az azonnali munkaerő-lecserélésről szóló főcímek ellenére a GDPval azt mutatja, hogy még a legjobb modellek is csak most érik el a szakemberekkel való egyenlő szintet bizonyos feladatokban. De ha ez a benchmark hasonló az AI világ más benchmarkjaihoz, akkor nem sok idő múlva a fejlettebb modellek jelentős ugrást tesznek, mindössze néhány hónapos gyorsulással. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Perplexity és a Harvard tanulmánya feltérképezi az összetett AI ágens alapú munka felé való eltolódást
3 napja
Az MIT tanulmánya azonosítja a legfőbb AI-kockázatokat és a felelős intézményeket
4 napja
Tanulmány: Az AI tutorok felülmúlják a jogi kart
2026. június 4.
Tudj meg többet
AI a kutatásban és oktatásban: Hatékony irodalomkutatás és forráselemzés
ChatGPT használata a munkában: Gyakorlati útmutató irodai dolgozóknak