MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Nvidia új kvantálási módszere nagy hatékonyságú érvelést tesz lehetővé Blackwell GPU-kon

Az Nvidia megjelentette a Nemotron-Nano-3-30B-A3B-NVFP4 modellt, egy 30 milliárd paraméteres érvelési modellt, amelyet 4-bites formátumra kvantáltak, így akár négyszer nagyobb áteresztőképességet ér el Blackwell GPU-kon. A modell a Quantization Aware Distillation (QAD) technikát alkalmazza, amely egy kvantált tanuló modellt tanít meg arra, hogy leképezze egy nagy pontosságú tanár modell kimenetét. Ez az innováció lehetővé teszi, hogy a modell visszanyerje az eredeti verzió teljesítményének szinte egészét, miközben jelentősen csökkenti a memória- és számítási igényeket.

Miért fontos?

Ez a kutatás utat mutat az összetett érvelési modellek sokkal hatékonyabb futtatásához, lehetővé téve a nagy teljesítményű AI használatát kisebb hardvereken az intelligencia feláldozása nélkül. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Perplexity és a Harvard tanulmánya feltérképezi az összetett AI ágens alapú munka felé való eltolódást
3 napja
Az MIT tanulmánya azonosítja a legfőbb AI-kockázatokat és a felelős intézményeket
4 napja
Tanulmány: Az AI tutorok felülmúlják a jogi kart
2026. június 4.
Tudj meg többet
AI a kutatásban és oktatásban: Hatékony irodalomkutatás és forráselemzés
Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?