← Zpět na Tech News
Tento článek je z archivu. Byl publikován 15.12.2025.
📰 SiliconANGLE News

Nvidia spouští rodinu modelů Nemotron 3 jako otevřenou základnu pro agentické AI systémy

Nvidia spouští rodinu modelů Nemotron 3 jako otevřenou základnu pro agentické AI systémy

Souhrn

Společnost Nvidia spustila rodinu otevřených AI modelů Nemotron 3, která má sloužit jako základna pro vývoj agentických systémů umělé inteligence. Modely využívají novou hybridní latentní architekturu směsi expertů (mixture-of-experts), která snižuje potřebu paměti a zvyšuje výkon. Nejmenší varianta Nano dosahuje čtyřnásobného propustku oproti předchůdci při zachování vysoké výkonnosti.

Klíčové body

  • Rodina modelů: Nano (30 miliard parametrů, 3 miliardy aktivních), Super (100 miliard parametrů, 10 miliard aktivních) a Ultra.
  • Architektura: hybridní latentní mixture-of-experts pro kompresi paměti, optimalizaci výpočtů a vyšší inteligenci.
  • Cíl: Podpora agentických AI, které zahrnují uvažování (reasoning) a orchestraci nástrojů (tool orchestration).
  • Otevřenost: Volně dostupné modely a datové knihovny pro vývojáře.
  • Citát Jensena Huanga: „Otevřená inovace je základem pokroku v AI. S Nemotronem přeměňujeme pokročilou AI na otevřenou platformu pro škálovatelné agentické systémy.“

Podrobnosti

Nvidia, přední výrobce grafických procesorů (GPU) nezbytných pro trénink velkých jazykových modelů (LLM), uvedla Nemotron 3 jako odpověď na rostoucí poptávku po agentických AI aplikacích. Tyto systémy překračují jednoduché chatboti a umožňují automatizaci složitých úkolů prostřednictvím koordinace více modelů, uvažování nad daty a volání externích nástrojů, jako jsou databáze nebo API rozhraní.

Klíčovou inovací je hybridní latentní metoda mixture-of-experts (MoE). Tradiční MoE modely, jako Mixtral od Mistral AI, aktivují pouze část parametrů pro efektivitu, ale Nvidia přidává latentní kompresi, která dále snižuje paměťové nároky a zrychluje inference. Například Nemotron 3 Nano s 30 miliardami celkových parametrů aktivuje jen 3 miliardy, což umožňuje nasazení na edge zařízeních nebo v cloudu s nízkými náklady. Model Super s 100 miliardami parametrů (10 miliard aktivních) cílí na náročnější úkoly, jako orchestrace v průmyslových aplikacích. Ultra varianta, i když detaily nebyly plně specifikovány, slouží pro největší škály.

Výkon Nano je podle Nvidia čtyřnásobně vyšší v propustce než u předchozí generace, při zachování kvality uvažování. To řeší přechod od statických chatbotů k dynamickým agentům, kteří například v podnikovém prostředí automatizují workflow: analyzují data, volají nástroje pro výpočty a generují akce. Nvidia tak vstupuje do soutěže s otevřenými modely jako Llama od Meta nebo Mistral, kde se klíčové metriky posouvají od velikosti parametrů k orchestraci, spolehlivosti a agentické výkonnosti.

Modely jsou ihned dostupné na platformách jako Hugging Face, společně s datovými knihovnami pro doladění (fine-tuning). Vývojáři je mohou integrovat do systémů pro specifické úkoly, například autonomní plánování v logistice nebo diagnostiku v medicíně.

Proč je to důležité

Nemotron 3 posiluje postavení Nvidia v otevřeném AI ekosystému, kde dosud dominovaly společnosti jako OpenAI nebo Anthropic s uzavřenými modely. Snížením nákladů na inference (díky MoE) umožňuje širší adopci agentických systémů v průmyslu, kde agentická AI slibuje automatizaci složitých procesů. V kontextu soutěže s čínskými modely (např. Qwen) nebo evropskými (Mistral) Nvidia nabízí hardware-software integraci, protože její modely jsou optimalizovány pro Nvidia GPU.

Pro uživatele to znamená přístup k výkonným agentickým nástrojům bez vysokých poplatků za API, což urychlí inovace v oblastech jako robotika nebo autonomní vozidla. Kriticky: Ačkoli architektura je slibná, dlouhodobá spolehlivost agentů závisí na benchmarkách jako GAIA nebo AgentBench, které zatím nebyly zveřejněny. Nvidia tak nastavuje standard pro efektivní open-source AI, ale musí prokázat nadřazenost v reálných nasazeních.


Číst původní článek

Zdroj: 📰 SiliconANGLE News

© 2025 Marigold.cz