Az új open-source modellek, a Tülu 3 és a Mistral Small 3 kihívás elé állítják a DeepSeek-et
Az open-source mesterséges intelligencia piacán soha nem látott mértékű pezsgés tapasztalható, amely alapjaiban kérdőjelezi meg a zárt, kereskedelmi modellek dominanciáját. A legújabb fejlemények értelmében a DeepSeek egyeduralma veszélybe került, hiszen a napokban debütált Tülu 3 405B és a Mistral Small 3 is komoly kihívást intéz a piacon lévő megoldásokkal szemben. Míg a seattle-i nonprofit Ai2 a teljesítmény tekintetében vette célba az iparági csúcsot, addig a párizsi Mistral a hatékonyságra és a lokális futtathatóságra helyezte a hangsúlyt. Ezek az innovációk nem csupán technológiai mérföldkövek, hanem az átláthatóság és a hozzáférhetőség iránti növekvő igényt is tükrözik a fejlesztői közösségben.
A Tülu 3 405B érkezése különösen figyelemreméltó, mivel az Ai2 modellje közvetlenül a DeepSeek V3-as verzióját utasítja maga mögé, teljesítményében pedig az OpenAI zászlóshajójával, a GPT-4o-val említhető egy lapon. A projekt legfőbb értéke az open-source filozófia radikális képviselete: a fejlesztők ugyanis teljes betekintést engednek a tanítási adatokba és az alkalmazott módszertanba, ami a zárt rendszerek korában ritkaságnak számít. Ezzel szemben a Mistral Small 3 egy teljesen más irányból közelíti meg a problémát. A céljuk egy olyan modell létrehozása volt, amely a csúcskategóriás MacBookokon is futtatható, miközben a Llama 3.3 képességeit nyújtja a paraméterek csupán harmadának felhasználásával. Ez a fajta optimalizáció kulcsfontosságú lehet a jövőben, hiszen lehetővé teszi a komplex AI-alkalmazások használatát drága szerverparkok nélkül, akár közvetlenül a felhasználók otthoni eszközein.
A versenybe beszállt egy új szereplő, az Oumi nevű labor is, amely egy ambiciózus, úgynevezett feltételek nélküli open-source AI-platform felépítését tűzte ki célul. A Stanford, a Princeton és az MIT kiválóságaiból verbuválódott csapat a kutatói silók lebontásán dolgozik, ami azt jelenti, hogy az iparági izoláció helyett a nyílt tudásmegosztást támogatják. Ez a folyamat rendkívül fontos az egész szektor számára, hiszen az open-source modellek fejlődése demokratizálja az AI-technológiát. Míg a DeepSeek R1-es modellje jelenleg a figyelem középpontjában áll, ezek az új fejlesztések azt bizonyítják, hogy a nyílt forráskódú közösség képes gyorsan reagálni a piaci igényekre, és olyan alternatívákat kínálni, amelyek egyszerre biztosítanak versenyképes teljesítményt és nagyobb kontrollt a technológia felett. Az elkövetkező időszakban az lesz a döntő kérdés, hogy melyik megközelítés bizonyul fenntarthatónak hosszú távon a gyorsan változó tech-ökoszisztémában.
- A Tülu 3 405B megegyezik a GPT-4o teljesítményével, és felülmúlta a DeepSeek V3 modelljét.
- A Tülu teljesen nyitott, így a kutatók láthatják a felépítéséhez használt tanítási adatokat és módszereket.
- A Mistral Small 3-at úgy tervezték, hogy helyileg fusson a lakossági hardvereken, például a csúcskategóriás MacBookokon.
- A Mistral modellje a Llama 3.3 teljesítményét nyújtja a paraméterek mindössze egyharmadának használatával.
- Az új Oumi labor top kutatókat toboroz egy feltételek nélküli open-source AI-platform létrehozásához.