MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A DeepSeek V3 open-source modell felveszi a versenyt a legjobb zárt forráskódú rendszerekkel

Ha már a nagy modellekről beszélünk, az ünnepek alatt megjelent a DeepSeek V3, amely jelenleg a legerősebb elérhető open-source AI modell. Teljesítményben megelőzi a Meta Llama modelljét, és bizonyos feladatokban még az OpenAI és az Anthropic zárt modelljeivel is pariban van. Lényegében ChatGPT-4 minőséget nyújt open-source formában – annyira hasonló hozzá, hogy néha ugyanazokat a vicceket meséli, és elfelejti, hogy valójában nem a ChatGPT. Nem viccelünk, néha szó szerint azt hiszi magáról, hogy ő a ChatGPT.

De van egy bökkenő: hatalmas. Egy 671 milliárd paraméteres óriásról beszélünk. Az optimális futtatáshoz vagy 18 darab A100 GPU-ra (540-720 ezer dollár), 9 darab H100 GPU-ra (270-360 ezer dollár), vagy 4 darab AMD MI300X GPU-ra (kb. 60 ezer dollár) van szükség.

Miért fontos?

Eddig a fizikai AI-rendszerek tanítása rendkívül drága és időigényes volt. Bár az NVIDIA 3000 dolláros szuperszámítógépe hatalmas lépés az AI demokratizálása felé, még mindig messze vagyunk attól, hogy a legfejlettebb modelleket az íróasztalunkon futtassuk. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Google 2000 nyugdíjas Pixel telefonból épít szuperszámítógépet
3 órája
A Moonshot AI kiadta a nyílt forráskódú Kimi 2.7-Code modellt
5 órája
Az AARRI-Bench etikus és gondos kutatógyakornokként értékeli az AI-ágenseket
7 órája
Tudj meg többet
DeepSeek vs. ChatGPT vs. Claude: Melyik AI gondolkodik a legjobban?
A legjobb AI Chrome bővítmények: Így turbózd fel a böngésződet