Souhrn
Na veletrhu CES 2026 NVIDIA představila platformu Rubin, jejímž stěžejním prvkem je rack-scale systém Vera Rubin NVL72. Tento systém spojuje šest čipů navržených společně tak, aby fungovaly jako jednotný celek, a představuje třetí generaci rackových architektur NVIDIA. Všechny čipy prošly výrobou a nyní procházejí validací s reálnými výpočetními úlohami v AI.
Klíčové body
- Systém Vera Rubin NVL72 obsahuje 72 Rubin GPU a 36 Vera CPU s 88 ARM jádry Olympus na každý CPU.
- FP4 inference výkon dosahuje 3,6 ExaFLOPS, což je 2,5násobek oproti Blackwell Ultra NVL72 (1,44 ExaFLOPS).
- Vera CPU nabízí NVLink-C2C připojení s 1,8 TB/s šířkou pásma k GPU, dvojnásobek oproti předchozí generaci.
- GPU používají HBM4 paměť s přibližně 22 TB/s šířkou pásma a NVLink 6 s 3,6 TB/s na GPU.
- Platforma je určena pro AI továrny, zaměřené na datové pohyby a agentické zpracování.
Podrobnosti
Vera Rubin NVL72 staví na konceptu tzv. extrémního spoludizajnu, při kterém NVIDIA vyvíjí šest různých čipů současně, aby maximalizovaly vzájemnou kompatibilitu a výkon v rackovém formátu. Klíčovým prvkem je Vera CPU, postavený na 88 vlastních ARM jádrech Olympus s plnou kompatibilitou Armv9.2. Tento procesor je optimalizován pro AI továrny, kde řeší nároky na pohyb dat a agentické zpracování – tj. autonomní AI agenty schopné rozhodování a interakce. Vera CPU zdvojnásobuje výkon v datovém zpracování, kompresi a kompilaci kódu oproti předchozí Grace CPU a díky NVLink-C2C připojení dosahuje 1,8 TB/s šířky pásma k Rubin GPU, což je sedminásobek rychlosti PCIe Gen 6.
Pro srovnání s předchozí generací Blackwell Ultra NVL72:
| Specifikace | GB300 NVL72 (Blackwell Ultra) | VR NVL72 (Vera Rubin) |
|---|---|---|
| GPU počet | 72 Blackwell Ultra GPU | 72 Rubin GPU |
| CPU počet | 36 Grace CPU | 36 Vera CPU |
| CPU jádra na CPU | 72 ARM jádra | 88 Olympus ARM jádra |
| FP4 inference výkon | 1,44 ExaFLOPS | 3,6 ExaFLOPS |
| NVFP4 na GPU (inference) | 20 PFLOPS | 50 PFLOPS |
| NVFP4 na GPU (trénink) | 10 PFLOPS | 35 PFLOPS |
| GPU paměť | HBM3e | HBM4 |
| GPU paměťová šířka pásma | ~8 TB/s | ~22 TB/s |
| NVLink generace | NVLink 5 | NVLink 6 |
| NVLink šířka pásma na GPU | 1,8 TB/s | 3,6 TB/s |
Rubin GPU přinášejí NVFP4 formát pro inference (50 PFLOPS na GPU) a trénink (35 PFLOPS), což umožňuje efektivnější zpracování velkých jazykových modelů (LLM) a jiných AI úloh. Systém je navržen pro datová centra, kde slouží k tréninku a nasazení AI modelů v měřítku exaFLOPS. NVIDIA plánuje dodávky od partnerů od léta 2026, což znamená, že reálné nasazení přijde až po validaci.
Proč je to důležité
Tato platforma posiluje dominanci NVIDIA v hardwaru pro AI, kde rackové systémy jako NVL72 umožňují škálování na úrovni tisíců GPU bez ztráty efektivity. Pro průmysl to znamená rychlejší inference pro velké LLM, nižší spotřebu energie na FLOPS a lepší podporu agentických AI systémů, které simulují složité pracovní toky. V kontextu soutěže s AMD a Intel to udržuje NVIDIA náskok v NVLink propojení, ale závislost na HBM4 paměti zvyšuje náklady. Pro uživatele v enterprise segmentu to otevírá dveře k výkonnějším AI továrnám, avšak s dodací lhůtou 2026 to zatím neovlivní aktuální nasazení. Celkově urychluje přechod k hyperskálovým AI infrastrukturám potřebným pro pokročilé modely.
Zdroj: 📰 Storagereview.com