Souhrn
OpenAI uzavřelo tříletou dohodu v hodnotě 10 miliard dolarů s firmou Cerebras Systems, která se specializuje na vývoj velkých čipů pro umělou inteligenci. Tímto partnerstvím OpenAI získává 750 megawattů výpočetního výkonu a snižuje svou závislost na grafických procesorech NVIDIA. Cerebras dodá čipy optimalizované pro AI inference, což umožní zpracování přes 3000 tokenů za sekundu.
Klíčové body
- Desetimiliardová, tříletá smlouva na 750 MW výpočetního výkonu pro rychlejší AI služby jako ChatGPT.
- Cerebras čipy s integrovanou pamětí překonávají tradiční GPU v AI inference pod těžkými zátěžemi.
- Snížení dominance NVIDIA v AI hardware díky specializovaným řešením.
- Podpora skalovatelnosti a efektivity pro rostoucí poptávku po real-time AI.
- Širší trend k specializovanému hardware pro úsporu energie.
Podrobnosti
Firma Cerebras Systems, založená v roce 2016, vyvíjí tzv. wafer-scale enginy – největší čipy na světě s miliardami tranzistorů na jedné křemíkové ploše. Jejich nejnovější model CS-3 je navržený přímo pro úlohy umělé inteligence, jako je inference velkých jazykových modelů (LLM), kde generuje odpovědi na základě trénovaných dat. Na rozdíl od grafických procesorů NVIDIA, které jsou univerzální a optimalizované pro grafiku i výpočty, mají čipy Cerebras integrovanou paměť přímo na čipu, což minimalizuje zpoždění při přenosu dat. To umožňuje konzistentní výkon i při zpracování obrovských objemů dat, jako je generování tisíců tokenů za sekundu – například přes 3000 tokenů/s, což je klíčové pro interaktivní aplikace jako ChatGPT.
Partnerství OpenAI s Cerebras přichází v době, kdy poptávka po výpočetním výkonu pro AI exploduje. OpenAI, tvůrce modelů GPT, dosud spoléhalo na кластery NVIDIA H100 GPU, které jsou drahé a energeticky náročné. Nová dohoda poskytne 750 MW výkonu, což odpovídá kapacitě stovek tisíc GPU, ale s vyšší efektivitou. Cerebras slibuje až 100násobné zrychlení inference, což znamená okamžité odpovědi v ChatGPT bez čekání. Tento krok je součástí širšího trendu: firmy jako Google s TPU nebo Amazon s Trainium hledají alternativy k NVIDIA, která kontroluje 80-90 % trhu AI hardware. Cerebras již dodává systémy pro výzkum, například pro biomedicínské simulace nebo finanční modelování, kde rychlost inference urychluje iterace.
Proč je to důležité
Toto partnerství signalizuje posun v AI infrastruktuře směrem k specializovaným čipům, což může snížit náklady na provoz AI služeb o desítky procent díky lepší energetické úspoře – klíčové v době rostoucích cen elektřiny. Pro uživatele to znamená plynulejší zkušenost s AI nástroji, jako je rychlejší generování textu nebo analýza dat v reálném čase. Pro průmysl to oslabuje monopol NVIDIA, což může vést k cenové válce a inovacím. Nicméně Cerebras je stále menším hráčem oproti NVIDIA, jejich wafer-scale design vyžaduje speciální chlazení a výrobu, což zvyšuje rizika škálovatelnosti. Dlouhodobě to urychlí vývoj pokročilých AI systémů, včetně směrem k AGI, tím že uvolní zdroje pro trénink nových modelů.
Zdroj: 📰 Geeky Gadgets