Google

Google: Gemini 3 Flash Preview

google/gemini-3-flash-preview
Agentní workflow Multimodální uvažování (Reasoning) Nízká latence
💰
Vstup
$0.5/1M
📤
Výstup
$3.0/1M
📏
Kontext
1048576
📝
Max výstup
65535
Vstup: text image file audio video Výstup: text

Gemini 3 Flash Preview je vysokorychlostní, vysoce hodnotný myšlenkový model navržený pro agentní pracovní postupy, vícekolové konverzace a asistenci při kódování. Poskytuje úroveň uvažování a výkonu při používání nástrojů blížící se verzi Pro s podstatně nižší latencí než větší varianty Gemini, díky čemuž je vhodný pro interaktivní vývoj, dlouhotrvající agentní smyčky a úlohy kolaborativního kódování. Ve srovnání s Gemini 2.5 Flash poskytuje široké zlepšení kvality v oblasti uvažování, multimodálního porozumění a spolehlivosti.

Model podporuje kontextové okno o velikosti 1M tokenů a multimodální vstupy včetně textu, obrázků, zvuku, videa a PDF, s textovým výstupem. Zahrnuje konfigurovatelné uvažování prostřednictvím úrovní myšlení (minimální, nízká, střední, vysoká), strukturovaný výstup, používání nástrojů a automatické ukládání kontextu do mezipaměti. Gemini 3 Flash Preview je optimalizován pro uživatele, kteří chtějí silné uvažování a agentní chování bez nákladů nebo latence plnohodnotných frontier modelů.

Unikátní charakteristiky

Gemini 3 Flash Preview unikátně kombinuje nízkou latenci a cenu kategorie ‘Flash’ s pokročilými schopnostmi uvažování (Thinking levels), které byly dříve doménou pouze největších modelů. Model se vyznačuje masivním kontextovým oknem 1M tokenů a nativní podporou zpracování videa, audia a dokumentů v reálném čase.

Silné stránky

Poměr cena/výkon

S cenou $0.50 za 1M vstupních tokenů nabízí schopnosti uvažování (reasoning) výrazně levněji než srovnatelné modely od OpenAI či Anthropic.

Konfigurovatelné uvažování

Unikátní možnost nastavit hloubku přemýšlení (minimal až high) umožňuje vývojářům dynamicky vyvažovat latenci a kvalitu výstupu podle typu úlohy.

Multimodální kontext

Kombinace 1M kontextového okna s nativním zpracováním videa a audia umožňuje efektivní analýzu dlouhých multimediálních záznamů bez nutnosti externí transkripce.

Slabé stránky

Cena výstupu

Poměr ceny výstupu k vstupu (6:1) je vysoký; generování dlouhých textů je relativně dražší ($3.00/1M) ve srovnání s velmi levným vstupem.

Konkurence v kontextu

Ačkoliv je 1M tokenů nadstandard, konkurenční modely x-AI (Grok) nabízejí v podobné cenové hladině dvojnásobný kontext (2M).

Srovnání s konkurencí

Anthropic Claude Haiku 4.5
Gemini je 2x levnější na vstupu a 1.6x levnější na výstupu

Gemini nabízí 5x větší kontext (1M vs 200k) a pokročilejší 'thinking' schopnosti; Haiku 4.5 může být rychlejší pro jednoduché textové úlohy.

x-AI Grok 4.1 Fast
Gemini je 2.5x dražší na vstupu a 6x dražší na výstupu

Grok vítězí hrubou cenou a velikostí kontextu (2M), Gemini kontruje lepší integrací agentních nástrojů a nativním zpracováním videa/audia.

OpenAI GPT-5.2 Chat
Gemini je 3.5x levnější na vstupu a 4.6x levnější na výstupu

Gemini 3 Flash poskytuje srovnatelnou či lepší kvalitu uvažování za zlomek ceny GPT-5.2 Chat a nabízí téměř 8x větší kontext.

Doporučení

Cílová skupina

  • Vývojáři autonomních agentů
  • Platformy pro analýzu dat a videa
  • SaaS aplikace vyžadující komplexní logiku s nízkou latencí

Vhodné pro

  • Dlouhodobé agentní smyčky (agent loops)
  • Analýza dlouhých videí a audio záznamů
  • Interaktivní asistence při kódování (díky nízké latenci)

Nevhodné pro

  • Extrémně levné klasifikační úlohy (zde je lepší Grok nebo Mistral)
  • Úlohy vyžadující absolutně nejvyšší možnou přesnost bez ohledu na cenu (zde volit Opus 4.5 nebo GPT-5.2 Pro)

Verdikt

Gemini 3 Flash Preview je aktuálně nejvýhodnější volbou pro komplexní agentní systémy, kde je kritická rovnováha mezi schopností uvažování, velikostí kontextu a provozními náklady.