A Meta Llama 4 modelljeit kritika éri a benchmark rangsorokban való visszaesés miatt
A Meta legújabb nagy nyelvi modelljei, a Llama 4 sorozat tagjai, nem várt nehézségekkel néznek szembe alig néhány nappal a hivatalos debütálásuk után. Míg a technológiai közösség felfokozott várakozásokkal tekintett Mark Zuckerberg csapatának legújabb fejlesztésére, a friss benchmark adatok és teljesítménymérések hidegzuhanyként érték a piacot. A Llama 4 modellek ugyanis a megjelenést követő rövid időn belül látványos visszaesést mutattak a legfontosabb iparági rangsorokban, ami azonnali kritikákat váltott ki a szakértőkből. Számos elemző és fejlesztő már most „kudarcként” emlegeti a projektet, rámutatva arra, hogy az új generáció nem hozta el azt az áttörést, amit az open-source közösség és a befektetők reméltek tőle a korábbi sikerek után.
A helyzet azért is különösen kényes, mert a benchmark rangsorok, mint például az LMSYS Chatbot Arena vagy a különböző kódolási és logikai tesztek, alapvető fontosságúak az AI modellek piaci megítélésében. A Meta korábbi verziója, a Llama 3, hatalmas sikert aratott, és hosszú ideig a legjobb nyílt forráskódú alternatívaként tartották számon, amely képes volt érdemben felvenni a versenyt a zárt forráskódú óriásokkal, mint az OpenAI GPT-4-ese vagy az Anthropic Claude modelljei. A Llama 4 esetében azonban úgy tűnik, a kezdeti lendület gyorsan elfogyott. A technikai közösségben folyó diskurzus szerint a modell bizonyos területeken, például az összetett matematikai feladatok megoldásában és a kreatív írásban alulmarad a közvetlen riválisaival szemben, ami komoly kérdéseket vet fel a Meta fejlesztési irányvonalával kapcsolatban.
A kritikusok szerint a visszaesés rávilágít arra a problémára, hogy a modellek méretének és a felhasznált GPU kapacitásnak a drasztikus növelése nem feltétlenül garantálja a lineáris fejlődést a teljesítményben. A Meta hatalmas összegeket fektetett az infrastruktúrába és a tanítási folyamatokba, de ha a Llama 4 nem képes tartósan a rangsorok élén maradni, az megkérdőjelezheti a vállalat AI stratégiájának hatékonyságát. Ez a visszaesés azért is fájdalmas, mert a startup világ és a fejlesztők jelentős része az ingyenesen vagy olcsó API-kon keresztül elérhető, magas minőségű nyílt modellekre építette a jövőbeli terveit. Amennyiben a Llama 4 tényleg elmarad a várakozásoktól, az a fejlesztőket arra kényszerítheti, hogy visszatérjenek a drágább, zárt ökoszisztémák használatához a jobb eredmények érdekében.
Fontos ugyanakkor megjegyezni, hogy az AI szektor rendkívül gyorsan változik, és egy-egy gyengébb szereplés még nem jelenti a Meta végleges lemaradását a mesterséges intelligencia versenyben. Ugyanakkor a mostani negatív visszhangok és a rangsorokban való lecsúszás egyértelmű jelzés Zuckerbergék számára, hogy a konkurencia – különösen a Google és az Anthropic – jelenleg hatékonyabb optimalizációs eljárásokat alkalmazhat. A következő hetek sorsdöntőek lesznek a Llama 4 megítélése szempontjából, hiszen a technikai közösség tüzetesen vizsgálja a modellek válaszait és stabilitását a valós felhasználási körülmények között. Ha a Meta nem tud gyors finomhangolással vagy szoftveres frissítésekkel válaszolni a kritikákra, a Llama 4 könnyen az AI történelem egyik legnagyobb csalódásaként vonulhat be a köztudatba.