Anthropic-tanulmány: A szakterületi szakértelem kritikusabb, mint a programozási készség
Meglepő eredményekre világított rá az Anthropic legújabb vizsgálata, amelyben a fejlesztők összesen 400 000 Claude Code munkamenetet elemeztek, hogy megértsék, hogyan működnek együtt az emberek és az AI-ágensek a gyakorlatban. A kutatás egyik legfontosabb tanulsága, hogy a sikeres munkavégzéshez korántsem a programozói készségek a legmeghatározóbbak, hanem sokkal inkább a felhasználó saját szakterületén szerzett szakértelme. Bár az AI-ágens végzi a nehéz munkát, a folyamat során a döntések jelentős részét az ember hozza meg, így a technológia értéke nagyban függ attól, mennyire érti a felhasználó a rábízott feladat szakmai hátterét.
A vizsgálat adatai szerint a munkafolyamatok egyértelmű munkamegosztást mutatnak: a felhasználók a tervezési döntések 70 százalékát ők maguk hozzák meg, míg a tényleges végrehajtás 80 százalékát már a Claude végzi el. A szakértelem szerepe azonban döntő a hatékonyságban, hiszen a tapasztalt szakemberek promptonként sokkal nagyobb eredményt érnek el, átlagosan 12 akciót és 3200 szavas kimenetet generálva. Az adatokból kirajzolódik egyfajta készségbeli szakadék is, ugyanis a középhaladó felhasználók sikerességi rátája nagyjából duplája a kezdőkénak, 30 százalék körüli arányban, szemben a kezdők 15 százalékával. Különösen figyelemreméltó, hogy a nem programozó háttérrel rendelkező szakemberek, mint például a jogászok vagy a tudományos kutatók, szinte ugyanolyan hatékonysággal tudták használni az ágenst kódolási feladatokra, mint a szoftvermérnökök.
Ez a trend rávilágít arra, hogy a mesterséges intelligencia nem csupán felgyorsítja a meglévő folyamatokat, hanem a nehezebb, akár szakterületeken átívelő feladatok irányába tereli a munkavállalókat. Hasonló következtetésre jutott a közelmúltban a Perplexity és a Harvard közös tanulmánya is, amely arra mutatott rá, hogy az AI-eszközök valódi értéke nem a modell nyers erejében rejlik, hanem abban, mennyire képes a felhasználó a szaktudását hatékonyan kamatoztatni az ágens irányításakor. A jövőben tehát a versenyképesség kulcsa várhatóan nem a kódolás technikai részleteinek ismerete lesz, hanem az a stratégiai rálátás, amellyel az ember a bonyolult szakmai problémákat megfogalmazza és felügyeli az AI közreműködésével.
- Users make approximately 70% of planning decisions, while Claude handles 80% of execution.
- Experts generate significantly more yield per prompt (12 actions/3,200 words) compared to beginners.
- Success rates for intermediate users are double those of novices (approx. 30% vs 15%).
- Non-coders (lawyers, scientists) performed nearly as well as software engineers when using the agent for coding tasks.
This data rhymes with the Perplexity-Harvard study we covered last week, where agents pushed people toward harder, cross-field work rather than just faster work. Both point in the same direction, with the value of agents being capped less by the model itself and more by how much its user actually understands the job.