MÉLYELEMZÉS
Minden, amit az NVIDIA bejelentett a GTC-n: Az 1 billió dolláros Vera Rubin platform
Az NVIDIA GTC konferenciája az AI iparág hivatalos „Super Bowl”-jaként szolgál, ahol iparági szereplők, influencerek és startupok gyűlnek össze. Az idei előadáson Jensen Huang legalább 1 billió dolláros, nagy biztonsággal jósolható keresletet jelentett be 2027-ig, és megjegyezte, hogy a számítási kapacitás 40 milliószorosára nőtt az elmúlt évtizedben. A középpontban a Vera Rubin platform áll, amely hét új chipből és öt rack-típusból áll, és amelyet úgy terveztek, hogy egyetlen hatalmas AI szuperszámítógépként működjön. A Rubin GPU-kat és Vera CPU-kat az új Groq 3 LPX következtetési (inference) gyorsítóval párosítja, hogy megawattonként akár 35-szörös (és potenciálisan 50-szeres) nagyobb következtetési áteresztőképességet biztosítson. Dylan Patel chipelemző azzal vádolta Jensent, hogy szándékosan alulbecsüli a teljesítményadatokat („sandbagging”), hogy a valós eredmények még lenyűgözőbbnek tűnjenek – ezt az állítást Jensen nem cáfolta.
- A Vera Rubin platform hét új chipet és öt rack-típust tartalmaz.
- A Rubin GPU-kat és Vera CPU-kat Groq 3 LPX következtetési gyorsítókkal párosítja.
- Akár 50-szer nagyobb következtetési áteresztőképességet biztosít megawattonként.
- Jensen Huang megerősítette a teljesítményadatok szándékos alulbecsülését, hogy később túlteljesíthessék az elvárásokat.
- Az NVIDIA arra törekszik, hogy az AI infrastruktúra piacának „Inference King”-je (következtetési királya) legyen.
Miért fontos?
Az adatközpontok fix energiakerettel rendelkeznek, így a bevétel szempontjából a wattonkénti token az egyetlen mérvadó mutató. A Vera Rubin 5-ször több bevételt termel gigawattonként, mint az előző Blackwell generáció. ---