Souhrn
Google představil třetí verzi svého multimodálního modelu umělé inteligence Gemini 3 a poskytl exkluzivní pohled do vývojového procesu. Tým za projektem odhalil, že záměrné zpoždění vydání, interní použití AI pro trénování modelů a výrazné zlepšení textového rozhraní byly klíčové pro aktuální konkurenceschopnost systému.
Klíčové body
- Gemini 3 byl záměrně zpožděn o šest měsíců oproti původnímu plánu, aby tým zajistil robustnost a bezpečnost.
- Vývojáři využili starší verze AI k generování a filtrování trénovacích dat pro novější modely – tzv. „AI staví AI“.
- Textové rozhraní (text-only inference) bylo výrazně vylepšeno, což umožňuje rychlejší a přesnější zpracování jazykových úloh bez nutnosti multimodálního vstupu.
- Tým klade důraz na uživatelskou zpětnou vazbu a iterativní vývoj, nikoli na rychlé „demo efekty“.
Podrobnosti
Gemini 3 byl oficiálně spuštěn v listopadu 2025, tedy šest měsíců po představení Gemini 2.5 Pro na konferenci Google I/O. Toto zpoždění nebylo důsledkem technických problémů, ale strategického rozhodnutí týmu vedeného Tulsee Doshi (seniorní ředitelka produktu pro modely Gemini). Cílem bylo zajistit, že model nejen splní interní metriky výkonu, ale také bude odolný vůči manipulaci a chybám v reálném provozu.
Zásadní inovací je využití starších verzí modelů k automatickému generování a klasifikaci trénovacích dat pro novější verze. Tento přístup – označovaný jako „AI-assisted data curation“ – zvyšuje efektivitu vývoje a snižuje závislost na manuálním štítkování dat. Zároveň však vyžaduje pečlivé kontroly, aby se zabránilo šíření chyb z jedné generace modelu do další.
Textové rozhraní, dříve považované za méně prioritní než multimodální funkce, nyní dosahuje výrazně lepších výsledků v úlohách jako je logické uvažování, kódování nebo generování strukturovaných odpovědí. To umožňuje efektivnější nasazení modelu v API a backendových službách, kde není potřeba zpracovávat obraz nebo video.
Proč je to důležité
V kontextu intenzivního závodu mezi Googlem, OpenAI a Anthropic je tento přístup příkladem „pomalé a pečlivé“ strategie, která se snaží vyvážit inovace s bezpečností a spolehlivostí. Zatímco konkurence často spoléhá na rychlé vydání demonstračních verzí, Google vsází na dlouhodobou udržitelnost a důvěru uživatelů. To může být klíčové pro nasazení AI v citlivých oblastech jako je zdravotnictví, právo nebo finanční služby, kde chyba modelu má významné důsledky. Zároveň ukazuje, že i v rychle se vyvíjejícím odvětví AI může být zpoždění konkurenční výhodou.
Zdroj: 📰 ZDNet
|