Souhrn
Amazon Web Services (AWS) na konferenci re:Invent v Las Vegas oznámila rozšíření rodiny základních modelů Nova o čtyři nové varianty a platformu Nova Forge pro jejich přizpůsobení. Nové modely přinášejí podporu pro multimodální vstupy včetně textu, obrázků, videa a řeči, s důrazem na různé úrovně složitosti uvažování a specifické aplikace jako konverzace v reálném čase nebo agentické programování.
Klíčové body
- Nova 2 Lite: Cenově efektivní model pro běžné úlohy, zpracovává text, obrázky a video, generuje textové výstupy; umožňuje řízení krok-za-krokem uvažování pro optimalizaci latence a přesnosti; obsahuje vestavěné webové prohledávání a provádění kódu.
- Nova 2 Pro: Nejschopnější model pro pokročilé úlohy, podporuje text, obrázky, video a řeč; vhodný pro dlouhodobé plánování, složité instrukce a agentické kódování; slouží také jako učitelský model pro destilaci menších variant.
- Nova 2 Sonic: Model řeč-na-řeč pro real-time konverzace v několika jazycích, s kontextovým oknem 1 milion tokenů (ekvivalent 75 000 řádků kódu nebo 1500 stran textu); integruje se s hlasovými systémy.
- Nova Forge: Platforma pro vývoj customizovaných variant modelů Nova, umožňuje uživatelům přizpůsobit modely specifickým pracovním zátěžím.
Podrobnosti
AWS tak posiluje svou pozici v oblasti generativní AI tím, že rozšiřuje rodinu Nova o modely optimalizované pro různé úrovně složitosti. Nova 2 Lite je navržen pro každodenní workloady jako chatboti pro zákaznický servis, analýza dokumentů nebo automatizace podnikových procesů. Uživatelé mohou nastavit míru krok-za-krokem uvažování, což umožňuje vyvážit rychlost odpovědi a přesnost – například pro rychlé dotazy lze minimalizovat hloubku analýzy, zatímco složitější úkoly využijí plnou logiku. Vestavěné funkce webového prohledávání (web grounding) zajišťují aktuální informace v odpovědích, zatímco provádění kódu umožňuje dynamické řešení programovacích úkolů přímo v modelu.
Nova 2 Pro cílí na náročnější scénáře, jako je dlouhodobé plánování v autonomních agentech, zpracování komplexních instrukcí nebo generování kódu s agentickými schopnostmi, kde model autonomně rozhoduje o dalších krocích. Podpora řeči rozšiřuje vstupy za hranice textu a vizuálu, což je klíčové pro aplikace jako virtuální asistenti nebo analýza videokonferencí. Model lze použít i pro destilaci, kdy slouží jako zdroj znalostí pro trénink menších, specializovaných modelů, což snižuje náklady na inference pro zákazníky s omezenými zdroji.
Nova 2 Sonic se zaměřuje na hlasové interakce: sjednocuje porozumění a generování textu i řeči, podporuje vícejazyčné konverzace v reálném čase, přičemž úlohy běží asynchronně na pozadí. Obrovské kontextové okno 1 milion tokenů umožňuje zpracování dlouhých konverzací nebo rozsáhlých datových sad, například analýzu tisíců stran dokumentace v hlasové formě. Integrace s Amazonovými službami usnadňuje nasazení v interaktivních hlasových systémech, jako jsou call centra nebo chytré reproduktory.
Platforma Nova Forge umožňuje vývojářům vytvářet varianty modelů na míru, což zahrnuje fine-tuning na proprietárních datech nebo optimalizaci pro specifické hardware. Oznámení proběhlo v kontextu rostoucí konkurence v cloudu, kde AWS soutěží s Azure OpenAI a Google Vertex AI.
Proč je to důležité
Tyto novinky posilují AWS jako komplexního poskytovatele AI v cloudu, kde zákazníci získají nativní multimodální modely bez nutnosti integrace třetích stran jako GPT-4o nebo Gemini. Pro podniky znamená to nižší náklady na vývoj agentů a hlasových systémů, s důrazem na bezpečnost a compliance díky proprietární infrastruktuře AWS. V širším ekosystému urychlují adopci multimodální AI v průmyslu, ale zároveň zdůrazňují rizika závislosti na jednom poskytovateli – modely Nova zatím nedosahují úrovně otevřených alternativ jako Llama v benchmarkách na kreativitu. Dlouhodobě to může stimulovat inovace v edge computingu a real-time AI, zejména v sektoru automatizace a zákaznické podpory.
Zdroj: 📰 SiliconANGLE News
|