MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Alibaba Qwen2-Math open-source modellje felülteljesíti a GPT-4o-t és a Claude-ot a benchmarkokon

Az Alibaba nemrégiben bemutatta a legújabb nyelvi modelljét, a Qwen2-Math nevet viselő open-source megoldást, amely komoly mérföldkövet jelent az AI fejlesztések történetében. A vállalat hivatalos bejelentése alapján ez az új, kifejezetten matematikai problémák megoldására optimalizált modell képes volt felülteljesíteni a piacvezető zárt forráskódú riválisait bizonyos teszteken. A Qwen2-Math rendkívüli teljesítményt nyújtott, és a mérési eredmények, vagyis a benchmarkok alapján maga mögé utasította az olyan jól ismert és széles körben elterjedt rendszereket, mint az Anthropic által fejlesztett Claude 3.5 Sonnet, az OpenAI-féle ChatGPT-4o, valamint a Google saját fejlesztésű Gemini Math modellje. Ez a lépés jelentősen átalakíthatja a technológiai szektor jelenlegi erőviszonyait, hiszen egy nyílt forráskódú modell vette át a vezetést a komplex matematikai képességek terén.

Az open-source modellek világa az elmúlt időszakban hatalmas fejlődésen ment keresztül, és az Alibaba legújabb áttörése hűen bizonyítja, hogy a nyílt közösség és a transzparens fejlesztések képesek felvenni a versenyt a tech óriások dollármilliárdokból fejlesztett, szigorúan zárt rendszereivel. Amikor egy open-source modell, mint a Qwen2-Math, képes bizonyos specifikus benchmarkokon legyőzni a ChatGPT-4o vagy a Claude 3.5 Sonnet szintű óriásokat, az azt jelzi, hogy a célirányos fejlesztés és a matematikai logikára való fókuszálás rendkívül kifizetődő stratégiának bizonyul. A matematikai feladatok precíz megoldása ráadásul hagyományosan az egyik legnehezebb kihívás az LLM modellek számára, így az elért eredmény még inkább felértékeli a kínai vállalat mérnökeinek munkáját.

A Google Gemini Math, az OpenAI ChatGPT-4o és az Anthropic Claude 3.5 Sonnet modellek felülteljesítése a gyakorlatban azt jelenti, hogy a kutatók, a fejlesztők és a különböző tech vállalatok mostantól egy olyan nyílt technológiához férhetnek hozzá, amely bizonyos matematikai kalkulációk és összetett logikai problémák kezelése során hatékonyabb alternatívát nyújt, mint a piacon lévő fizetős API szolgáltatások. Az Alibaba ezzel a lépéssel nemcsak a saját pozícióját erősíti meg a globális AI piacon, hanem egyúttal jelentősen hozzájárul a csúcskategóriás mesterséges intelligencia elérésének lehetőségeihez is. Mivel a Qwen2-Math open-source formában lett kiadva, a globális fejlesztői közösség szabadon tanulmányozhatja, finomhangolhatja és integrálhatja azt a saját munkafolyamataiba, ami újabb innovációs hullámot indíthat el az iparágban, és új alapokra helyezheti a nyílt forráskódú modellek megítélését.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
AI chatbotot indít a The Washington Post az éghajlattal kapcsolatos kérdésekre
2026. május 24.
Az OpenAI blokkolja a hozzáférést Kínában, miközben a Microsoft fenntartja a támogatást
2026. május 24.
Elon Musk xAI cége független adatközpontot épít a Grok 2 számára
2026. május 24.