Souhrn
Na CES 2026 NVIDIA oznámila platformu Rubin, sestávající z šesti komponentů včetně Vera Rubin GPU s výkonem 35 petaflops pro trénink AI modelů, což představuje 3,5násobné zrychlení oproti předchozí generaci. Klíčové prvky zahrnují NVLink 6 s propustností 3,6 TB/s pro propojení více GPU a HBM4 paměť s 22 TB/s, navržené pro efektivní zpracování složitých úloh v agentic AI a robotice. Tato platforma umožňuje škálování pro hyperscalery a aplikace jako retrieval-augmented generation (RAG).
Klíčové body
- Vera Rubin GPU: 35 petaflops pro trénink, určené pro velké jazykové modely (LLM) a autonomní systémy.
- NVLink 6: propojení s 3,6 TB/s, slouží k vytváření clusterů GPU pro paralelní výpočty.
- HBM4 paměť: 22 TB/s propustnost, zajišťuje rychlý přístup k datům při intenzivních AI operacích.
- BlueField-4 DPU: zpracovává datové toky, odlehčuje GPU od síťových a úložištních úkolů.
- Podpora pro agentic AI: umožňuje AI agentům autonomní rozhodování v robotice a průmyslových aplikacích.
Podrobnosti
Platforma Rubin je navržena jako odpověď na rostoucí požadavky agentic AI, kde modely nejen generují text, ale aktivně interagují se světem, například v robotice nebo autonomních systémech. Středobodem je Vera Rubin GPU, pojmenovaná po americké astronomce, která dosahuje 35 petaflops při tréninku, což umožňuje zpracování obřích datových sad rychleji než u Blackwell architektury. NVLink 6, interconnect pro více GPU, poskytuje 3,6 TB/s bandwidth, což znamená, že cluster stovek GPU může sdílet data bez zúchytů, ideální pro trénink modelů s biliony parametrů.
HBM4 paměť s 22 TB/s pak zajišťuje, že GPU mají okamžitý přístup k datům, což snižuje latenci při inference – fázi, kdy AI model odpovídá na dotazy. BlueField-4 DPU, data processing unit od NVIDIA, přebírá úlohy jako síťové zpracování nebo přístup k úložišti, což uvolňuje GPU pro čistě výpočetní práci. Celý systém podporuje RAG, techniku kde AI doplňuje znalosti z externích databází, což zlepšuje přesnost odpovědí v aplikacích jako zdravotnictví nebo průmyslová automatizace.
NVIDIA tak pokračuje v dominanci na trhu AI hardware, kde její GPU pohánějí většinu velkých LLM jako GPT nebo Llama. Rubin následuje po Blackwell a předchází dalším generacím, s důrazem na škálovatelnost pro datová centra hyperscalerů jako Microsoft nebo Google. Pro vývojáře to znamená kratší dobu tréninku modelů, nižší energetickou náročnost a lepší podporu pro robotické systémy, kde AI musí zpracovávat reálný časový vstup z senzorů.
Proč je to důležité
Tato platforma posiluje pozici NVIDIA v AI ekosystému, kde hardware určuje tempo inovací v LLM a agentic AI. Pro průmysl znamená rychlejší nasazení autonomních vozidel, robotických linek nebo AI v medicíně, kde inference v reálném čase zachraňuje životy. Zároveň zdůrazňuje závislost na NVIDIA, což může způsobit rizika v dodavatelském řetězci, ale urychluje pokrok směrem k pokročilejším AI systémům. V širším kontextu umožňuje hyperscalerům efektivněji konkurovat v AI službách, což ovlivní ceny cloudových výpočtů a dostupnost technologií.
Zdroj: 📰 Geeky Gadgets