AI ÁTTÖRÉSEK
A Moonshot AI Kimi K2.6 modellje megszünteti az open-source hátrányt
A Moonshot AI Kimi nyílt forráskódúvá tette a K2.6-ot, egy új, ügynökszerű kódoló modellt, amely a vezető benchmarkokon – mint a gondolkodás és kódolás – megközelíti vagy felülmúlja az olyan modelleket, mint a GPT-5.4, az Opus 4.6 és a Gemini 3.1 Pro, mindezt a költségek töredékéért.
- A K2.6 felülmúlja a GPT-5.4, Opus 4.6 és Gemini 3.1 Pro modelleket a benchmarkokon, beleértve a Humanity’s Last Exam w/ tools (gondolkodás) és SWE-Bench Pro (kódolás) teszteket.
- Hosszú távú feladatok esetén a K2.6 képes 12+ órát folyamatosan dolgozni 4000+ eszközhíváson keresztül, a Kimi demókban egy 8 éves kódbázis refaktorálását mutatta be.
- Az olyan folyamatosan aktív ügynökök, mint az OpenClaw és a Hermes, most már a K2.6-on futnak, a Kimi arról számolt be, hogy egy belső ügynök öt napon keresztül autonóm módon működött.
- A K2.6 ügynökrajai mostantól 300 párhuzamos al-ügynököt tudnak egyidejűleg elindítani a feladatok elvégzésére, ami a K2.5 elődjének háromszorosa.
Miért fontos?
Dario Amodei nemrég azt mondta, hogy az open-source és Kína 6-12 hónappal le vannak maradva a vezető laboroktól, és bár ez igaz lehet a belső kiadásokra, a nyilvános rendszerek sokkal közelebb állnak. Tekintettel a használati díjak miatti frusztrációkra és az autonóm ügynökök térnyerésére, a K2.6 erőteljes, költséghatékony új lehetőségnek tűnik az ügynökalapú munkafolyamatokhoz. ---