Új mércén bizonyított az AI a szabadúszó munkaerőpiacon
Új mérföldkőhöz érkezett a mesterséges intelligencia a szabadúszó munkaerőpiacon, hiszen a Center for AI Safety és a Scale Labs legfrissebb közös kutatása, a Remote Labor Index végre objektív adatokkal támasztja alá, mire is képesek az AI-ágensek a valódi, professzionális munkakörnyezetben. A felmérés szerint az iparág döbbenetes fejlődésen ment keresztül az elmúlt évben: az élvonalbeli modellek teljesítménye hatszorosára nőtt, a tavalyi eredményekhez képest pedig az Anthropic Fable 5 modellje minden eddigi rekordot megdöntött azzal, hogy a projektek több mint 16 százalékában a hivatásos szakemberekkel azonos vagy jobb minőségű munkát produkált.
A Remote Labor Index jelentősége abban rejlik, hogy szakít a hagyományos, gyakran mesterséges tesztkörnyezeteket használó benchmarkokkal, és helyette 240 valódi, komplex munkát elemez. A teszt során olyan konkrét feladatokat kellett megoldaniuk az AI-ágenseknek, mint a bonyolult 3D ékszertervezés, az animált hirdetések összeállítása vagy éppen precíz alaprajzok készítése. A teljesítményt nem algoritmusok, hanem tapasztalt humán szakemberek bírálták el, ami hiteles képet ad arról, hogyan állják meg a helyüket ezek a technológiák a modern kreatív és technikai iparágakban. A 2025 októberi induláskor a piacot vezető GPT 5.2 még mindössze 2,5 százalékos automatizációs rátát tudott felmutatni, ezzel szemben a jelenlegi rangsorban a Fable 5 mögött az Opus 4.8 érte el a második helyet 8,3 százalékkal, míg az OpenAI GPT-5.5 modellje 6,3 százalékos mutatóval a harmadik lett.
Bár az egy év alatt elért ugrás önmagában is lenyűgöző, a szakma óva int a túlzott optimizmustól, hiszen a valóság még messze van a teljes körű automatizációtól. A jelenlegi mezőnyből kiemelkedő, legfejlettebb modell is csak minden hatodik feladatnál volt képes önállóan elérni a professzionális minőséget, ami azt jelenti, hogy a szabadúszók számára a közeljövőben nem a teljes leváltás, hanem a hatékonyság növelése jelenti a valódi értéket. A technológia tehát inkább egyfajta turbófeltöltőként szolgálhat: a szabadúszók termelékenysége drasztikusan megnőhet a segítségével, ám az ítéletalkotáshoz, a kritikus gondolkodáshoz és a végső finomhangoláshoz továbbra is elengedhetetlen marad az emberi szakértelem és kreativitás. A jövő munkamódszere így egyfajta hibrid modell felé mutat, ahol a gép végzi az alapozó és repetitív műveleteket, a szakember pedig a minőségbiztosításért és a kreatív irányításért felel.
- A Remote Labor Indexet 2025 októberében indították el, akkor a GPT 5.2 vezetett 2,5%-os automatizációs rátával.
- A teszt 240 valódi munkát tartalmazott olyan területeken, mint a 3D ékszertervezés, animált hirdetések és alaprajzok készítése, a teljesítményt pedig profi szakemberek bírálata alapján pontozták.
- Az Anthropic Fable 5 modellje a projektek 16,1%-ában érte el vagy haladta meg a humán szakértők teljesítményét.
- Az Opus 4.8 a második helyet szerezte meg 8,3%-kal, az OpenAI GPT-5.5 modellje pedig a harmadik lett 6,3%-kal.
Bár az egy év alatt elért ugrás jelentős, a valóság az, hogy a jelenlegi mezőnyből messze kiemelkedő modell is csak minden hatodik szabadúszó feladatnál volt képes professzionális minőséget nyújtani. A várható forgatókönyv inkább az, hogy a technológiát használó szabadúszók termelékenysége drasztikusan megnő, miközben az ítéletalkotáshoz és a finomhangoláshoz továbbra is szükség lesz az emberi közreműködésre.