📰 Business Insider

Generální ředitel IBM: Žádným způsobem se nevyplatí utrácet biliony na AI datacentra při současných nákladech na infrastrukturu

Generální ředitel IBM: Žádným způsobem se nevyplatí utrácet biliony na AI datacentra při současných nákladech na infrastrukturu

Souhrn

Generální ředitel IBM Arvind Krishna prohlásil, že investice v řádu bilionů dolarů do AI datacenter od velkých technologických firem se při současných nákladech na infrastrukturu nevyplatí. Na základě hrubých výpočtů ukázal, že návratnost takových výdajů by vyžadovala nereálně vysoké příjmy z AI služeb. Jeho skeptický pohled kontrastuje s masivními plány firem jako Microsoft, Google nebo Meta na rozšíření výpočetní kapacity pro trénink velkých jazykových modelů.

Klíčové body

  • Velké technologické firmy plánují utratit přes 1 bilion USD za výstavbu a provoz AI datacenter v příštích letech.
  • Současné náklady na GPU, elektřinu a chlazení činí desítky miliard dolarů na jedno velké datacenter, s ročními provozními náklady v řádu stovek milionů.
  • Pro dosažení návratnosti by AI služby musely generovat příjmy v řádu stovek miliard dolarů ročně, což Krishna považuje za nerealistické.
  • IBM se zaměřuje na efektivnější AI modely, které snižují potřebu obrovských datacenter, například pomocí technik jako model compression nebo federované učení.
  • Krishna navrhuje, že pokles cen GPU a lepší energetická účinnost by mohly situaci změnit, ale ne v krátkodobém horizontu.

Podrobnosti

Arvind Krishna, generální ředitel IBM, která se dlouhodobě zabývá enterprise AI řešeními jako Watsonx – platformou pro nasazení otevřených AI modelů v podnikovém prostředí –, předvedl během nedávného rozhovoru pro Business Insider tzv. napkin math, tedy hrubé odhady na základě veřejně dostupných dat. Podle něj hyperscaleři jako Microsoft, Amazon a Google plánují investovat 1 až 2 biliony USD do AI datacenter do roku 2030, aby zvládli trénink a inference modelů jako GPT-4 nebo Gemini, které vyžadují tisíce GPU typu Nvidia H100.

Při konkrétních číslech: Jedno typické AI datacenter s kapacitou 100 megawattů stojí na stavbu kolem 10 miliard USD, včetně GPU v ceně 30 000 USD za kus. Roční náklady na elektřinu při spotřebě 100 MW a ceně 0,10 USD za kWh dosahují 80 milionů USD, bez údržby a chlazení, které přidávají dalších 20–30 %. Pro návratnost investice za 5 let by takové datacenter muselo generovat příjmy přes 2 miliardy USD ročně, což znamená, že zákazníci by museli platit za AI inference desítky dolarů za milion tokenů – v porovnání s současnými cenami kolem 0,01–0,10 USD.

Krishna zdůrazňuje, že současná infrastruktura není optimalizovaná pro AI workloady. GPU jsou energeticky náročné, s výkonem kolem 700 W na kus, a datacentra dosahují PUE (Power Usage Effectiveness) okolo 1,2–1,5, což znamená ztráty na chlazení. IBM naopak investuje do hybridních řešení, kde se velké modely trénují centralizovaně, ale inference běží na edge zařízeních nebo menších clusterech s nižšími náklady. Například jejich Granite modely v Watsonx jsou navrženy pro efektivitu, snižují počet parametrů bez ztráty výkonu díky technikám jako quantization, což umožňuje provoz na běžných CPU místo GPU.

Tento pohled přichází v době, kdy Nvidia hlásí rekordní tržby z prodejů GPU, ale analytici varují před bublinou: celkové capex hyperscalerů dosáhly v roce 2024 přes 200 miliard USD, převážně na AI. Krishna nepopírá růst AI trhu, odhadovaný na 200 miliard USD do 2025, ale poukazuje na nesoulad mezi náklady a příjmy.

Proč je to důležité

Krishnova analýza signalizuje potenciální zpomalení AI arms race, kde firmy soutěží v budování největších datacenter. Pokud se náklady nepropadnou díky pokrokům v chip designu (např. custom ASIC od Google TPU nebo Amazon Trainium) nebo levnější elektřině z obnovitelných zdrojů, může dojít k přehřátí trhu s GPU a způsobení poklesu akcií hyperscalerů. Pro průmysl to znamená tlak na efektivitu: méně parametrů v modelech, více open-source jako Llama od Meta a hybridní cloud-edge architektury. Uživatelé podniků tak mohou očekávat nižší ceny AI služeb, ale i riziko, že masivní investice povedou k konsolidaci trhu ve prospěch pár gigantů s nejlevnější energií. V širším kontextu to podtrhuje nutnost regulace energetické spotřeby AI, protože globální datacentra už spotřebovávají 2–3 % světové elektřiny a trend narůstá.


Číst původní článek

Zdroj: 📰 Business Insider

Číst původní článek
Původní název: IBM CEO says there is 'no way' spending trillions on AI data centers will pay off at today's infrastructure costs