📰 Next Big Future

Google Gemini 3: Úniky odhalují pokročilé schopnosti před oficiálním spuštěním

Google Gemini 3: Úniky odhalují pokročilé schopnosti před oficiálním spuštěním

Souhrn

Google připravuje třetí generaci svého multimodálního modelu umělé inteligence Gemini 3, která zatím nebyla oficiálně vydána. Přesto se některým vybraným uživatelům podařilo získat přístup k předběžným verzím – tzv. checkpointům – prostřednictvím chyb ve směrování požadavků nebo A/B testování v prostředích Google AI Studio a Vertex AI. Podle potvrzení generálního ředitele Sundara Pichaie bude finální verze k dispozici nejpozději do konce roku 2025.

Klíčové body

  • Kontextové okno až 1 milion tokenů, běžné verze s 200–500 tisíci tokeny
  • Přístup k předběžným verzím (např. ECPT) prostřednictvím testovacích kanálů
  • Výjimečné kódovací a kreativní schopnosti: generování plně funkčních webových aplikací
  • Úspěšné řešení dosud nevyřešeného matematického problému Somura č. 554
  • Paralelní trénování více než 13 větví modelu

Podrobnosti

Gemini 3 demonstruje výrazný skok v oblasti generování komplexního kódu a interaktivních multimediálních aplikací. V únicích se objevují příklady jako plně funkční repliky operačních systémů (Mac OS, Windows XP) v prohlížeči, včetně terminálu, správce souborů nebo her jako Had. Model dokáže vytvářet hratelné verze Minecraftu, interaktivní 3D voxelová umění nebo vektorovou grafiku (SVG) s matematicky přesnými pohyblivými částmi, například ovladači her nebo roboty. Tyto výstupy nejsou jen vizuální – obsahují plně funkční JavaScript, HTML a CSS kód, často v rozsahu tisíce řádků, a model přitom efektivně pracuje s omezením kontextového okna.

Z hlediska matematických schopností se Gemini 3 prokázal řešením Somurova problému č. 554, který dosud žádný jiný velký jazykový model nevyřešil. Tento úspěch naznačuje pokroky v oblasti formálního uvažování a automatického dokazování vět. Model je také označován za „nejkreativnější“ a „umělecky citlivý“ mezi současnými LLM, což se projevuje v generování originální hudby, interaktivních vědeckých vizualizací nebo her s kompletními herními mechanikami.

Proč je to důležité

Gemini 3 představuje významný krok směrem k praktickému využití pokročilé umělé inteligence v softwarovém inženýrství, vzdělávání a kreativních průmyslech. Schopnost generovat plně funkční, interaktivní aplikace bez nutnosti lidského doladění může zásadně změnit vývoj webových nástrojů a prototypování. Zároveň demonstruje, že Google intenzivně investuje do paralelního vývoje více verzí modelu, což zvyšuje šanci na objevení nejefektivnější architektury. V kontextu globální AI soutěže mezi Googlem, OpenAI a Anthropic je Gemini 3 strategickou odpovědí na nedávné pokroky konkurence, zejména v oblasti dlouhého kontextu a multimodality.


Číst původní článek

Zdroj: 📰 Next Big Future