Google 17. 12. 2025

Google: Gemini 3 Flash Preview

google/gemini-3-flash-preview

Agentní workflow Multimodální uvažování (Reasoning) Nízká latence

💰

Vstup

$0.5/1M

📤

Výstup

$3.0/1M

📏

Kontext

1048576

📝

Max výstup

65535

Vstup: text image file audio video → Výstup: text

Gemini 3 Flash Preview je vysokorychlostní, vysoce hodnotný myšlenkový model navržený pro agentní pracovní postupy, vícekolové konverzace a asistenci při kódování. Poskytuje úroveň uvažování a výkonu při používání nástrojů blížící se verzi Pro s podstatně nižší latencí než větší varianty Gemini, díky čemuž je vhodný pro interaktivní vývoj, dlouhotrvající agentní smyčky a úlohy kolaborativního kódování. Ve srovnání s Gemini 2.5 Flash poskytuje široké zlepšení kvality v oblasti uvažování, multimodálního porozumění a spolehlivosti.

Model podporuje kontextové okno o velikosti 1M tokenů a multimodální vstupy včetně textu, obrázků, zvuku, videa a PDF, s textovým výstupem. Zahrnuje konfigurovatelné uvažování prostřednictvím úrovní myšlení (minimální, nízká, střední, vysoká), strukturovaný výstup, používání nástrojů a automatické ukládání kontextu do mezipaměti. Gemini 3 Flash Preview je optimalizován pro uživatele, kteří chtějí silné uvažování a agentní chování bez nákladů nebo latence plnohodnotných frontier modelů.

Unikátní charakteristiky

Gemini 3 Flash Preview unikátně kombinuje nízkou latenci a cenu kategorie ‘Flash’ s pokročilými schopnostmi uvažování (Thinking levels), které byly dříve doménou pouze největších modelů. Model se vyznačuje masivním kontextovým oknem 1M tokenů a nativní podporou zpracování videa, audia a dokumentů v reálném čase.

Silné stránky

Poměr cena/výkon

S cenou $0.50 za 1M vstupních tokenů nabízí schopnosti uvažování (reasoning) výrazně levněji než srovnatelné modely od OpenAI či Anthropic.

Konfigurovatelné uvažování

Unikátní možnost nastavit hloubku přemýšlení (minimal až high) umožňuje vývojářům dynamicky vyvažovat latenci a kvalitu výstupu podle typu úlohy.

Multimodální kontext

Kombinace 1M kontextového okna s nativním zpracováním videa a audia umožňuje efektivní analýzu dlouhých multimediálních záznamů bez nutnosti externí transkripce.

Slabé stránky

Cena výstupu

Poměr ceny výstupu k vstupu (6:1) je vysoký; generování dlouhých textů je relativně dražší ($3.00/1M) ve srovnání s velmi levným vstupem.

Konkurence v kontextu

Ačkoliv je 1M tokenů nadstandard, konkurenční modely x-AI (Grok) nabízejí v podobné cenové hladině dvojnásobný kontext (2M).

Srovnání s konkurencí

Anthropic Claude Haiku 4.5

Gemini je 2x levnější na vstupu a 1.6x levnější na výstupu

Gemini nabízí 5x větší kontext (1M vs 200k) a pokročilejší 'thinking' schopnosti; Haiku 4.5 může být rychlejší pro jednoduché textové úlohy.

x-AI Grok 4.1 Fast

Gemini je 2.5x dražší na vstupu a 6x dražší na výstupu

Grok vítězí hrubou cenou a velikostí kontextu (2M), Gemini kontruje lepší integrací agentních nástrojů a nativním zpracováním videa/audia.

OpenAI GPT-5.2 Chat

Gemini je 3.5x levnější na vstupu a 4.6x levnější na výstupu

Gemini 3 Flash poskytuje srovnatelnou či lepší kvalitu uvažování za zlomek ceny GPT-5.2 Chat a nabízí téměř 8x větší kontext.

Doporučení

Cílová skupina

Vývojáři autonomních agentů
Platformy pro analýzu dat a videa
SaaS aplikace vyžadující komplexní logiku s nízkou latencí

Vhodné pro

Dlouhodobé agentní smyčky (agent loops)
Analýza dlouhých videí a audio záznamů
Interaktivní asistence při kódování (díky nízké latenci)

Nevhodné pro

Extrémně levné klasifikační úlohy (zde je lepší Grok nebo Mistral)
Úlohy vyžadující absolutně nejvyšší možnou přesnost bez ohledu na cenu (zde volit Opus 4.5 nebo GPT-5.2 Pro)

Verdikt

Gemini 3 Flash Preview je aktuálně nejvýhodnější volbou pro komplexní agentní systémy, kde je kritická rovnováha mezi schopností uvažování, velikostí kontextu a provozními náklady.