Az Alibaba Qwen with Questions modellje veri az OpenAI o1-preview benchmarkjait
Az Alibaba legújabb fejlesztése, a Qwen with Questions (QwQ) modell jelentős mérföldkövet ért el az AI-fejlesztések terén, ugyanis a vállalat állítása szerint számos benchmark teszten sikerült felülmúlnia az OpenAI csúcstechnológiás következtetési modelljét, az o1-preview-t. A kínai e-kereskedelmi óriás által bemutatott új chatbot a legfrissebb bizonyítéka annak a technológiai versenynek, amelyben a kínai modellek egyre hatékonyabban zárkóznak fel, vagy akár előzik is meg a nyugati nagyvállalatok vezető megoldásait. A QwQ különlegessége abban rejlik, hogy az OpenAI o1-hez hasonlóan képes a komplex problémákat kisebb, kezelhető lépésekre bontani, ami lehetővé teszi a modell számára, hogy a folyamat közben felismerje és korrigálja saját hibáit, így biztosítva pontosabb és logikusabb végeredményt.
Ez az újítás a chain-of-thought, azaz a gondolatmenet-lánc technológia alkalmazásában rejlik, amely alapjaiban változtatja meg azt, ahogyan az LLM-ek a bonyolult feladatokat megközelítik. Míg a korábbi modellek gyakran közvetlenül próbáltak választ adni a kérdésekre, a QwQ és az o1-preview módszertana egyfajta belső mérlegelési folyamatot vezet be, amely sokkal megbízhatóbbá teszi az összetett érvelést igénylő válaszokat. A QwQ ezzel a lépéssel csatlakozik ahhoz a kínai fejlesztésű modellekből álló illusztris csoporthoz, amelyben már megtalálható a DeepSeek R1-Lite-Preview és a Pekingi Egyetem által fejlesztett LLaVA-o1 is. Ezek a fejlesztések egyértelműen mutatják, hogy a kínai kutatói szféra és a technológiai óriások kiemelt figyelmet fordítanak a fejlett következtetési képességekkel rendelkező AI-k létrehozására.
A QwQ jelentősége túlmutat az egyszerű teljesítménybeli összehasonlításokon, hiszen a benchmarkokon elért sikerek rávilágítanak arra, hogy a modellarchitektúrák fejlődése milyen dinamikus irányt vett az elmúlt időszakban. A képesség, hogy egy AI modell saját működése közben reflektáljon a lépéseire, hosszú távon elengedhetetlen lesz a megbízhatóbb és biztonságosabb rendszerek kiépítéséhez, amelyek képesek lehetnek a tudományos kutatás vagy a komplex szoftverfejlesztés terén is hatékonyan támogatni a felhasználókat. Az Alibaba ezzel az újítással nemcsak saját technológiai arzenálját bővítette, hanem tovább fokozta a nemzetközi AI-versenyt, ahol a hangsúly már nem pusztán a nyers adatokon és a méreten van, hanem azon, hogy az adott rendszer mennyire képes logikusan és önkritikusan végigvezetni egy megoldási folyamatot. Az, hogy a kínai fejlesztések ilyen ütemben zárkóznak fel az OpenAI vezető technológiáihoz, jelzi, hogy az AI-iparág globális dinamikája folyamatosan és gyorsan változik.