Souhrn
Startup Ayar Labs, podporovaný Nvidií, spolupracuje s tchajwanským poskytovatelem návrhů polovodičů Global Unichip Corp (GUC) na integraci svých fotonických čipletů TeraPHY do referenčních návrhů XPU. Cílem je umožnit optickou komunikaci mezi čipy s agregovanou propustností přes 200 Tbps, což by umožnilo propojovat tisíce GPU napříč celými datovými centry bez zvýšení spotřeby energie.
Klíčové body
- Ayar Labs integruje své optické I/O čiplety TeraPHY do referenčních návrhů GUC pro XPUs.
- Optické propojení má nahradit měděné kabely, které omezují vzdálenost a vyžadují energeticky náročné retimery.
- Cílová propustnost přesahuje 200 Tbps, což je více než desetinásobek současných nejrychlejších elektrických propojení (14,4 Tbps).
- Cílem je propojit až 10 000 GPU v jedné škálovatelné doméně při udržení spotřeby na cca 100 kW na rack.
- Nvidia dříve volila měděné propojení kvůli vysoké spotřebě dostupných optických transceiverů.
Podrobnosti
Ayar Labs, specializující se na fotonické čiplety, chce prostřednictvím spolupráce s GUC – jedním z hlavních poskytovatelů návrhových služeb pro pokročilé polovodiče – prosadit svou technologii TeraPHY přímo do architektur XPUs (specializovaných akcelerátorů pro AI a HPC). Tyto čiplety umožňují převod elektrických signálů na optické přímo na čipu, což eliminuje potřebu externích optických transceiverů a snižuje latenci i spotřebu. Díky tomu by bylo možné propojovat výpočetní jednotky nejen v rámci jednoho racku, ale i napříč celými řadami nebo halami datových center, aniž by došlo ke zvýšení energetické náročnosti. V současnosti Nvidia ve svých systémech NVL72 používá měděné propojení, protože dostupné optické řešení by přidalo až 20 kW k již vysoké zátěži 120 kW na rack. Ayar Labs tvrdí, že jeho řešení umožní udržet spotřebu na úrovni cca 100 kW i při propojení tisíců GPU.
Proč je to důležité
Tato technologie by mohla zásadně změnit architekturu datových center zaměřených na AI a HPC. Optické propojení na úrovni čipu odstraňuje fyzické i energetické bariéry, které dnes brání škálování AI systémů nad rámec jednoho racku. Pokud se Ayar Labs a GUC podaří technologii komerčně nasadit, mohlo by to vést k výraznému zrychlení trénování velkých jazykových modelů a snížení nákladů na infrastrukturu hyperskalovatelných cloudových poskytovatelů. Zároveň by to posílilo konkurenci v oblasti meziprocesorové komunikace, kde dnes dominují elektrická řešení s omezeným dosahem.
Zdroj: 📰 Theregister.com
|