Új tanulmány szerint az AI ágensek akkor teljesítenek a legjobban, ha emberekkel dolgoznak együtt

2025. november 14. · MI Történik? · 1 perc olvasás

Az Upwork Human+Productivity Indexe (HAPI) az egyik első adatvezérelt értékelés az AI ágensek teljesítményéről valódi ügyfélmunkák során. A tanulmány három élvonalbeli modell (Claude Sonnet 4, Gemini 2.5 Pro és OpenAI GPT-5) AI ágenseit tesztelte 300 Upwork projekten keresztül, kifejezetten olyan egyszerű feladatokat választva, amelyeket az AI ágensek ésszerűen kezelni tudnak. A teszt eredményei azt mutatták, hogy az AI ágensek azokban a feladatokban teljesítenek a legjobban, amelyeknek objektíven helyes válaszaik vannak, mint például a matematika vagy az alapvető kódolás. De a minőségi munka, mint például a landing oldalak tervezése vagy a marketing szövegek írása? Ebben az ágensek küszködtek – legalábbis emberi irányítás nélkül. Az AI ágensek sokkal jobban teljesítettek, amikor emberi szakértőket vontak be a folyamatba. Átlagosan a feladatok befejezési aránya 70%-kal ugrott meg, amikor az emberek és az ágensek együttműködtek, szemben az ágensek egyedüli munkájával.

Kiértékelték a Claude Sonnet 4, Gemini 2.5 Pro és OpenAI GPT-5 modelleket
300 valós Upwork projekt teljesítményét elemezték
Az AI ágensek kiválóan teljesítettek az olyan objektív feladatokban, mint a matematika és a kódolás
Az ágensek nehézségekbe ütköztek a minőségi munkák során, mint a marketing és a tervezés
Az emberi együttműködés 70%-kal növelte a feladatok befejezési arányát

Miért fontos?

Miért fontos: Az Upwork eredményei azt mutatják, hogy az AI erejét irányító emberi szakértelem segíthet napoknyi munkát órákba sűríteni az automatizált munka és a szakértői finomítás iteratív ciklusaival. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Kreatív valós felhasználási esetek az OpenAI Deep Research eszközéhez

2026. május 25.

Új szakértői panel (LEAP) teszteli a munkaerőpiaci hatásokkal kapcsolatos merész AI állításokat

2025. november 13.

Az Anthropic kutatója szerint az AI képességei exponenciális ütemben duplázódnak

2025. szeptember 30.