Appleův AI serverový čip „Baltra“ bude pravděpodobně použit především pro AI inference

Souhrn

Apple pracuje na svém prvním serverovém čipu pro umělou inteligenci nazvaném „Baltra”, který by měl debutovat v roce 2027. Tento čip je navržen především pro inference, tedy fázi, kdy AI modely zpracovávají vstupy a generují výstupy v reálném čase. Spolupracuje na něm s firmou Broadcom, která zajišťuje klíčovou síťovou technologii, což umožňuje Applu obejít Nvidia.

Klíčové body

Čip „Baltra” bude vyrábět TSMC na 3nm procesu N3E, design by měl být dokončen během příštího roku.
Primární zaměření na AI inference pro uspokojení rostoucích potřeb Applu v oblasti serverových výpočtů.
Spolupráce s Broadcom na networkingovém subsystému, aby se snížila závislost na Nvidia.
Apple již v říjnu 2025 zahájil dodávky svých serverů vyrobených v USA.
Spekulace naznačují menší klastry čipů, podobné Nvidia GB300, s vysokorychlostní LPDDR pamětí.

Podrobnosti

Apple je známý svou strategií vertikální integrace, kdy si udržuje kontrolu nad klíčovými technologiemi, což je patrné z jeho rozsáhlého vývoje vlastních čipů, jako jsou řady M a A pro zařízení iPhone, iPad či Mac. Vstup do oblasti serverových čipů pro AI představuje logický další krok, zejména po spuštění Apple Intelligence, což je sada AI funkcí integrovných do iOS, macOS a dalších systémů. Tyto funkce, jako vylepšená Siri nebo generování obrázků, vyžadují obrovské výpočetní kapacity pro inference na serverech, kde Apple dosud spoléhá na externí dodavatele.

Podle zpráv z jara 2024 Apple zahájil spolupráci s Broadcom, specialistou na síťové polovodiče a čipy pro datová centra. Broadcom, který se dlouhodobě zabývá vývojem ASIC čipů pro hyperscalery jako Google nebo Meta, teď pomáhá Applu s networkingovou částí „Baltry”. To je klíčové, protože serverové AI systémy potřebují rychlou interkonekci mezi čipy pro efektivní distribuci úloh. Čip bude produkován na pokročilém 3nm procesu TSMC N3E, který umožňuje vyšší hustotu tranzistorů a nižší spotřebu oproti starším nodům. Očekává se, že deployment proběhne v roce 2027, přičemž Apple už nyní testuje vlastní servery vyrobené v USA.

Spekulace z komunity, jako od analytika Maxe Weinbacha, naznačují, že „Baltra” nebude součástí masivních klastrů tisíců čipů, ale spíš menších konfigurací, například 64 čipů v topologii all-to-all s velkou kapacitou LPDDR paměti. To by mělo být levnější než současné Nvidia řešení a optimalizované pro specifické inference úlohy Applu, jako zpracování hlasových dotazů nebo personalizovaných AI odpovědí. Nicméně jde o neoficiální informace z Twitteru a reportů, takže skutečné specifikace mohou být odlišné. Apple tak pokračuje v diverzifikaci dodavatelského řetězce, podobně jako při vývoji M-series čipů, které nahradily Intel procesory.

Proč je to důležité

Tento vývoj posiluje pozici Applu v AI ekosystému, kde inference tvoří většinu provozních nákladů oproti tréninku modelů. Závislost na Nvidia, která dominuje trhu s GPU pro AI, je pro Appla rizikem – ceny H100 či Blackwell čipů jsou vysoké a dodávky omezené. Vlastní „Baltra” umožní Applu snížit náklady, zlepšit latenci pro uživatele (např. rychlejší Siri odpovědi) a zajistit lepší integraci s ekosystémem Apple Intelligence. V širším kontextu to signalizuje trend vertikální integrace mezi technologickými giganty: Google má TPU, Amazon Inferentia/Trainium, Meta MTIA. Pro průmysl to znamená větší konkurenci pro Nvidia a Broadcom, potenciálně snižující ceny AI hardware. Pro uživatele to přinese spolehlivější AI služby od Applu, ale debut v 2027 znamená, že krátkodobý dopad bude omezený.

Číst původní článek

Zdroj: 📰 Wccftech