Souhrn
Google připravuje třetí generaci svého multimodálního modelu umělé inteligence Gemini 3, která zatím nebyla oficiálně vydána. Přesto se některým vybraným uživatelům podařilo získat přístup k předběžným verzím – tzv. checkpointům – prostřednictvím chyb ve směrování požadavků nebo A/B testování v prostředích Google AI Studio a Vertex AI. Podle potvrzení generálního ředitele Sundara Pichaie bude finální verze k dispozici nejpozději do konce roku 2025.
Klíčové body
- Kontextové okno až 1 milion tokenů, běžné verze s 200–500 tisíci tokeny
- Přístup k předběžným verzím (např. ECPT) prostřednictvím testovacích kanálů
- Výjimečné kódovací a kreativní schopnosti: generování plně funkčních webových aplikací
- Úspěšné řešení dosud nevyřešeného matematického problému Somura č. 554
- Paralelní trénování více než 13 větví modelu
Podrobnosti
Gemini 3 demonstruje výrazný skok v oblasti generování komplexního kódu a interaktivních multimediálních aplikací. V únicích se objevují příklady jako plně funkční repliky operačních systémů (Mac OS, Windows XP) v prohlížeči, včetně terminálu, správce souborů nebo her jako Had. Model dokáže vytvářet hratelné verze Minecraftu, interaktivní 3D voxelová umění nebo vektorovou grafiku (SVG) s matematicky přesnými pohyblivými částmi, například ovladači her nebo roboty. Tyto výstupy nejsou jen vizuální – obsahují plně funkční JavaScript, HTML a CSS kód, často v rozsahu tisíce řádků, a model přitom efektivně pracuje s omezením kontextového okna.
Z hlediska matematických schopností se Gemini 3 prokázal řešením Somurova problému č. 554, který dosud žádný jiný velký jazykový model nevyřešil. Tento úspěch naznačuje pokroky v oblasti formálního uvažování a automatického dokazování vět. Model je také označován za „nejkreativnější“ a „umělecky citlivý“ mezi současnými LLM, což se projevuje v generování originální hudby, interaktivních vědeckých vizualizací nebo her s kompletními herními mechanikami.
Proč je to důležité
Gemini 3 představuje významný krok směrem k praktickému využití pokročilé umělé inteligence v softwarovém inženýrství, vzdělávání a kreativních průmyslech. Schopnost generovat plně funkční, interaktivní aplikace bez nutnosti lidského doladění může zásadně změnit vývoj webových nástrojů a prototypování. Zároveň demonstruje, že Google intenzivně investuje do paralelního vývoje více verzí modelu, což zvyšuje šanci na objevení nejefektivnější architektury. V kontextu globální AI soutěže mezi Googlem, OpenAI a Anthropic je Gemini 3 strategickou odpovědí na nedávné pokroky konkurence, zejména v oblasti dlouhého kontextu a multimodality.
Zdroj: 📰 Next Big Future
|