A Huawei versenyképes, 718 milliárd paraméteres MoE modellt tanított Ascend processzorokon

AI HARDVER

A Huawei versenyképes, 718 milliárd paraméteres MoE modellt tanított Ascend processzorokon

2025. május 12. · MI Történik? · 1 perc olvasás

A Huawei egy nagyszabású mixture-of-experts (MoE) modellt tanított be körülbelül 6 000 „Ascend” processzorán. Ez egy korábbi munkára épül, amelyben egy figyelemre méltó denz modellt tanítottak ~8 000 „Ascend” processzoron. A két kutatási tanulmány együttesen rávilágít arra, hogy a Huawei jelentős erőforrásokat fektet abba a szoftverbe, amely szükséges ahhoz, hogy az Ascend chipeken ugyanolyan egyszerű legyen a tanítás, mint az NVIDIA chipeken. Mindkét tanulmány a kínai cégek azon technikai befektetéseinek jele, amelyek célja, hogy AI technológiai hátterüket függetlenítsék az amerikai tervezésű technológiáktól. A kapott MoE modell teljesítménye nagyjából egy szinten van a DeepSeek R1-gyel; 718 milliárd paramétert használ, ebből 39 milliárd aktív egy időben, szemben a DeepSeek 671 milliárd összes / 37 milliárd aktív paraméterével. A modell az R1-hez hasonló pontszámokat ér el, bizonyos orvosi értékeléseken és a széles körben használt GPQA-Diamond tudományos benchmarkon pedig le is győzi azt. A Huawei írja: „30,0%-os Model Flops Utilization (MFU) értéket és 1,46 millió Tokens Per Second (TPS) sebességet értünk el 6 000 Ascend NPU-n, szemben a 4 000 Ascend NPU-n mért 18,9%-os alap MFU-val és 0,61 millió TPS-sel.”

A modell összesen 718 milliárd paraméterrel rendelkezik, tokenenként 39 milliárd aktív paraméterrel.
6 000 darab Huawei Ascend NPU-ból álló klaszteren tanították.
30,0%-os Model Flops Utilization (MFU) értéket értek el.
A DeepSeek R1-gyel versenyképes teljesítményt mutatott fel.
Bizonyos orvosi értékeléseken és a GPQA-Diamond tudományos benchmarkon felülmúlta a DeepSeek R1-et.
Specifikus szoftveres megoldásokat fejlesztettek a tanítási hatékonyság növelésére nem-NVIDIA hardvereken.

Miért fontos?

Ez a fejlemény azt jelzi, hogy a kínai vállalatok sikeresen optimalizálják szoftveres környezetüket a hazai hardverekhez. Jelzi a beérő képességet a csúcskategóriás modellek betanítására anélkül, hogy az olyan amerikai tervezésű chipekre támaszkodnának, mint az NVIDIA termékei. ---

Eredeti forrás megtekintése (angol) →