Az Anthropic Claude Opus modellje trónfosztotta az OpenAI GPT-4-ét a fontosabb AI-benchmarkokon
A mesterséges intelligencia piacán hosszú ideje az OpenAI által fejlesztett GPT-4 számított a vitathatatlan királynak, azonban ez a korszak most a végéhez közeledhet. Az Anthropic legújabb büszkesége, a Claude 3 Opus modell ugyanis átvette a vezetést az egyik legfontosabb független AI-benchmark rangsorában, ezzel hivatalosan is trónfosztva a korábbi piacvezetőt. Ez a mérföldkő alapjaiban rendezheti át az LLM modellek versenyét, hiszen Amerika legújabb „topmodellje” bizonyította, hogy képes felülmúlni a tech óriás eddig verhetetlennek hitt technológiáját a legfontosabb értékeléseken.
A Claude 3 modellcsalád legnagyobb és legkomplexebb tagjaként bemutatott Opus jelenleg az LMSYS Chatbot Arena Leaderboard élén áll. Ez a felület egy rendkívül elismert, közösségi forrású nyílt platform, amely a felhasználók valós értékelései alapján rangsorolja az AI-modelleket, így az itt elért első helyezés komoly szakmai elismerést jelent. Az Anthropic fejlesztése nemcsak elméleti teszteken, hanem a mindennapi gyakorlati alkalmazások során is kimagasló teljesítményt nyújt, ami közvetlen fenyegetést jelent az OpenAI dominanciájára nézve.
A tech szektor számára azonban mégsem az Opus győzelme jelentette a legnagyobb meglepetést, hanem a Claude 3 család legkisebb tagja, a Haiku szereplése. A Haiku ugyanis képes volt legyőzni a GPT-4 egy korábbi verzióját, ami a modell rendkívül kompakt méretét figyelembe véve egészen lenyűgöző teljesítmény. A valódi sorsfordító tényező azonban a gazdaságossági mutatókban rejlik: a Haiku nagyságrendekkel olcsóbb és gyorsabb, mint a vetélytársai, ez az ár-teljesítmény kombináció pedig rendkívül csábító ajánlatot jelent a felhasználók és a szoftverfejlesztők számára. Bindu Reddy, az Abacus AI vezérigazgatója szerint ez kiváló hír a piacnak, hiszen végre elérhető egy GPT-4 szintű modell, amely ráadásul tízszer olcsóbb is annál. Nick Dobos alkalmazásfejlesztő szintén elragadtatással beszélt a fejleményekről, kiemelve, hogy egészen őrületes, mennyire gyors és költséghatékony lett az új technológia.
Ezzel a lépéssel a labda határozottan az OpenAI térfelére került, és a szakértők szerint a vállalatnak gyorsan kell reagálnia a kialakult helyzetre. Anton, az X platformon @abacaj néven ismert szoftvermérnök radikális véleményt fogalmazott meg, amikor kijelentette, hogy nem látja, miként maradhatna életben az OpenAI a jelenlegi GPT-3.5 és GPT-4 modellekkel, mivel a GPT-3.5 a Claude Haiku mellett szó szerint teljesen haszontalanná vált. Bár a verseny jelenleg az Anthropic javára dőlt el, az OpenAI valószínűleg nem hagyja annyiban a dolgot, és minden bizonnyal lesz egy-két szava a piachoz, amint elindítja a szakma által már nagyon várt, következő generációs GPT-5 modellt.