A HATÁRTERÜLETRŐL
Új tanulmány szerint az AI ágensek akkor teljesítenek a legjobban, ha emberekkel dolgoznak együtt
Az Upwork Human+Productivity Indexe (HAPI) az egyik első adatvezérelt értékelés az AI ágensek teljesítményéről valódi ügyfélmunkák során. A tanulmány három élvonalbeli modell (Claude Sonnet 4, Gemini 2.5 Pro és OpenAI GPT-5) AI ágenseit tesztelte 300 Upwork projekten keresztül, kifejezetten olyan egyszerű feladatokat választva, amelyeket az AI ágensek ésszerűen kezelni tudnak. A teszt eredményei azt mutatták, hogy az AI ágensek azokban a feladatokban teljesítenek a legjobban, amelyeknek objektíven helyes válaszaik vannak, mint például a matematika vagy az alapvető kódolás. De a minőségi munka, mint például a landing oldalak tervezése vagy a marketing szövegek írása? Ebben az ágensek küszködtek – legalábbis emberi irányítás nélkül. Az AI ágensek sokkal jobban teljesítettek, amikor emberi szakértőket vontak be a folyamatba. Átlagosan a feladatok befejezési aránya 70%-kal ugrott meg, amikor az emberek és az ágensek együttműködtek, szemben az ágensek egyedüli munkájával.
- Kiértékelték a Claude Sonnet 4, Gemini 2.5 Pro és OpenAI GPT-5 modelleket
- 300 valós Upwork projekt teljesítményét elemezték
- Az AI ágensek kiválóan teljesítettek az olyan objektív feladatokban, mint a matematika és a kódolás
- Az ágensek nehézségekbe ütköztek a minőségi munkák során, mint a marketing és a tervezés
- Az emberi együttműködés 70%-kal növelte a feladatok befejezési arányát
Miért fontos?
Miért fontos: Az Upwork eredményei azt mutatják, hogy az AI erejét irányító emberi szakértelem segíthet napoknyi munkát órákba sűríteni az automatizált munka és a szakértői finomítás iteratív ciklusaival. ---