Souhrn
Čínská firma DeepSeek, specializující se na vývoj velkých jazykových modelů, připravuje vydání DeepSeek V4, který využívá novou architekturu pro efektivní trénink s kontextovým oknem přes 1 milion tokenů a náklady pod 6 milionů dolarů. Trhy okamžitě zareagovaly poklesem Nasdaq futures o 1,8 %, investoři obviňují rostoucí konkurenci z Číny z potenciálního narušení valuací AI firem jako Nvidia nebo Microsoft. Zprávy o použití zakázaných Nvidia Blackwell čipů spustily federální vyšetřování exportních kontrol.
Klíčové body
- DeepSeek V4 trénován za méně než 6 milionů USD díky architektuře Engram conditional memory a Manifold-Constrained Hyper-Connections (mHC), umožňující zpracování kontextu 1 milion+ tokenů.
- Porovnání s USA: hyperscaleři plánují výdaje 527 miliard USD na AI infrastrukturu v roce 2026, což odhaluje možný capex bublinu.
- Použití Nvidia Blackwell čipů navzdory americkým exportním zákazům pro Čínu, což vede k federálnímu prozkoumání.
- Dopad na trh: pokles sentimentu u AI infrastrukturních akcií, otázky ohledně oprávněnosti vysokých valuací US firem.
- Model s výkonem na úrovni GPT-5, což zpochybňuje dominanci OpenAI a Google.
Podrobnosti
DeepSeek je čínská startupová společnost zaměřená na vývoj open-source velkých jazykových modelů (LLM), které konkurují západním řešením jako GPT nebo Llama. Jejich nadcházející model DeepSeek V4 zavádí revoluční prvky v architektuře: Engram conditional memory slouží k efektivnímu ukládání a vybavování dlouhodobých závislostí v datech, což umožňuje modelu zpracovávat extrémně dlouhé kontexty – přes 1 milion tokenů – bez ztráty výkonu. Druhý prvek, Manifold-Constrained Hyper-Connections (mHC), optimalizuje propojení neuronových vrstev, čímž snižuje výpočetní nároky během tréninku. Tyto technologie umožňují trénink modelu na relativně malém rozpočtu pod 6 milionů USD, oproti desítkám miliard, které investují americké giganty jako Microsoft nebo Google do clusterů s tisíci GPU.
Za posledních 12 měsíců Nasdaq Composite vzrostl o více než 30 % díky AI euforii, přičemž Nvidia přidala stovky miliard USD na tržní kapitalizaci díky poptávce po svých čipech H100 a Blackwell. DeepSeek V4 však nastavuje nový standard efektivity: pokud dosáhne výkonu srovnatelného s očekávaným GPT-5, ukáže, že masivní investice do infrastruktury nejsou nutností. To zpochybňuje projekce, podle nichž hyperscaleři utratí 527 miliard USD za AI hardware v roce 2026. Navíc zprávy, že DeepSeek použil pokročilé Nvidia Blackwell čipy – zakázané pro export do Číny kvůli národní bezpečnosti – spustily urgentní vyšetřování amerického ministerstva obchodu. Pokud se potvrdí porušení, mohlo by to vést k dalším sankcím a omezením přístupu Číny k západním technologiím.
Trh reagoval rychle: Nasdaq futures klesly o 1,8 % hned po úniku zpráv. Sentiment u akcií Nvidia, AMD a cloudových providerů jako AWS nebo Azure ochlazuje, protože investoři pochybují o udržitelnosti současného boomu. DeepSeek V4 by mohl být nasazen pro generování textu, kódování, analýzu dat nebo dokonce autonomní systémy, kde dlouhý kontext umožňuje lepší porozumění složitým úkolům.
Proč je to důležité
Tento vývoj zesiluje geopolitickou soutěž v AI mezi USA a Čínou, kde efektivita čínských modelů ohrožuje ekonomickou dominanci amerických firem. Pokud DeepSeek V4 potvrdí svůj výkon, donutí to OpenAI, Anthropic nebo Google optimalizovat své modely a snížit závislost na drahých čipech, což by mohlo stabilizovat trh, ale také způsobit korekci valuací. Pro uživatele znamená levnější přístup k pokročilým LLM, potenciálně open-source, což urychlí adopci AI v malých firmách a rozvojových zemích. Dlouhodobě to podtrhuje nutnost USA investovat do inovací v architektuře AI, nejen do hardwaru, aby udržely vedení. Celkový objem slov: 512.
Zdroj: 📰 The Times of India