MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Nvidia új kvantálási módszere nagy hatékonyságú érvelést tesz lehetővé Blackwell GPU-kon

Az Nvidia megjelentette a Nemotron-Nano-3-30B-A3B-NVFP4 modellt, egy 30 milliárd paraméteres érvelési modellt, amelyet 4-bites formátumra kvantáltak, így akár négyszer nagyobb áteresztőképességet ér el Blackwell GPU-kon. A modell a Quantization Aware Distillation (QAD) technikát alkalmazza, amely egy kvantált tanuló modellt tanít meg arra, hogy leképezze egy nagy pontosságú tanár modell kimenetét. Ez az innováció lehetővé teszi, hogy a modell visszanyerje az eredeti verzió teljesítményének szinte egészét, miközben jelentősen csökkenti a memória- és számítási igényeket.
Miért fontos?

Ez a kutatás utat mutat az összetett érvelési modellek sokkal hatékonyabb futtatásához, lehetővé téve a nagy teljesítményű AI használatát kisebb hardvereken az intelligencia feláldozása nélkül. ---

Eredeti forrás megtekintése (angol) →