Souhrn
Bílý dům autorizoval export AI akcelerátorů Nvidia H200 do Číny s 25procentním poplatkem na každou zásilku. Toto rozhodnutí pramení z rychlého pokroku Huawei v oblasti čipů Ascend 910C, zejména v systému CloudMatrix 384 s 384 integrovanými akcelerátory. Cílem je udržet americkou dominanci na globálním trhu AI hardware, přičemž pokročilé architektury Nvidia jako Blackwell a Rubin zůstávají omezené.
Klíčové body
- USA povolily export H200 s 25% poplatkem, přičemž zvažovaly varianty od úplného zákazu po nasycení trhu.
- Huawei CloudMatrix 384 dosahuje 300 petaflops v hustém BF16 výpočtu a překonává Nvidia GB200 NVL72 v surovém výkonu, paměti (3,6násobek) a šířce pásma paměti (více než dvojnásobek).
- Spotřeba energie je u Huawei téměř čtyřnásobná oproti Nvidia, což zvyšuje obavy z efektivity.
- Huawei nasadil tyto akcelerátory ve svých datových centrech a plánuje výrobu stovek tisíc kusů v příštím roce, potenciálně milionů do roku 2026.
- Čína vyvíjí vlastní sadu instrukcí CANN pro AI, ale Nvidia GPU zůstávají preferovanou volbou.
Podrobnosti
Američtí úředníci dlouhodobě omezují export pokročilých AI čipů do Číny kvůli obavám z technologického posunu Pekingu v oblasti umělé inteligence. Nejnovější zvrat představuje povolení exportu Nvidia H200, což jsou AI akcelerátory určené pro trénink a inference velkých jazykových modelů (LLM) a jiných náročných AI úloh. H200 navazuje na předchozí H100 s vylepšenou pamětí HBM3e, která umožňuje zpracovávat větší modely bez častého přenášení dat mezi čipy.
Klíčovým faktorem rozhodnutí se stalo Huawei, čínský gigant v telekomunikačních technologiích, který kvůli americkým sankcím vyvíjí vlastní AI hardware. Akcelerátor Ascend 910C je součástí rodiny Ascend, navržené pro paralelní výpočty v AI, podobně jako Nvidia GPU. Systém CloudMatrix 384 integruje 384 těchto čipů do jedné jednotky, což umožňuje škálovat výkon pro clustery v datových centrech. Podle interních zpráv tento systém překonává Nvidia GB200 NVL72 v některých metrikách: dosahuje 300 petaflops v BF16 (formát pro AI trénink s nižší přesností než FP32), má 3,6násobnou agregovanou paměť a více než dvojnásobnou šířku pásma paměti. To znamená lepší schopnost zpracovávat obrovské datasety pro trénink modelů jako GPT nebo Llama.
Nicméně Huawei platí cenu vyšší spotřebou energie – téměř čtyřnásobnou oproti Nvidia –, což je kritické v kontextu globálního nedostatku energie pro datová centra. V Číně, kde jsou datová centra Huawei napájena z abundatních zdrojů elektřiny, to méně vadí. Společnost přešla na vlastní softwareovou platformu CANN (Compute Architecture for Neural Networks), která slouží k optimalizaci AI výpočtů na Ascend čipech, nahrazuje CUDA od Nvidia a umožňuje nasazení modelů jako DeepSeek nebo Qwen. Huawei plánuje masivní expanzi výroby Ascend 910C, což by mohlo Čínu osamostatnit od západních dodavatelů.
Proč je to důležité
Toto rozhodnutí odhaluje napětí v globální AI ekosystému: USA riskují ztrátu trhu v Číně (druhém největším po USA), kde Huawei rychle dohání zpoždění způsobené sankcemi. Povolení H200 s poplatkem generuje příjmy pro americký průmysl a podporuje pracovní místa v Nvidia, ale chrání strategické technologie jako Blackwell (nová architektura s lepší efektivitou pro inference) a Rubin (další generace). Pro průmysl to znamená zvýšenou konkurenci: Huawei snižuje závislost na Nvidia, což může tlačit na ceny a inovace, ale jeho nižší efektivita omezuje univerzálnost.
V širším kontextu urychluje to „splitting“ AI světa na západní a čínský blok, kde CANN konkuruje CUDA. Pro uživatele a firmy v Evropě nebo Asii to znamená více možností, ale i rizika fragmentace ekosystému – modely trénované na jedné platformě nejsou snadno přenositelné. Dlouhodobě to posiluje Čínu v AGI závodě, i když Nvidia si udržuje náskok v efektivitě a ekosystému softwaru. (Celkem 512 slov)
Zdroj: 📰 TechRadar