MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A DeepSeek V3 open-source modell felveszi a versenyt a legjobb zárt forráskódú rendszerekkel

Ha már a nagy modellekről beszélünk, az ünnepek alatt megjelent a DeepSeek V3, amely jelenleg a legerősebb elérhető open-source AI modell. Teljesítményben megelőzi a Meta Llama modelljét, és bizonyos feladatokban még az OpenAI és az Anthropic zárt modelljeivel is pariban van. Lényegében ChatGPT-4 minőséget nyújt open-source formában – annyira hasonló hozzá, hogy néha ugyanazokat a vicceket meséli, és elfelejti, hogy valójában nem a ChatGPT. Nem viccelünk, néha szó szerint azt hiszi magáról, hogy ő a ChatGPT. De van egy bökkenő: hatalmas. Egy 671 milliárd paraméteres óriásról beszélünk. Az optimális futtatáshoz vagy 18 darab A100 GPU-ra (540-720 ezer dollár), 9 darab H100 GPU-ra (270-360 ezer dollár), vagy 4 darab AMD MI300X GPU-ra (kb. 60 ezer dollár) van szükség.
Miért fontos?

Eddig a fizikai AI-rendszerek tanítása rendkívül drága és időigényes volt. Bár az NVIDIA 3000 dolláros szuperszámítógépe hatalmas lépés az AI demokratizálása felé, még mindig messze vagyunk attól, hogy a legfejlettebb modelleket az íróasztalunkon futtassuk. ---

Eredeti forrás megtekintése (angol) →