Google 07. 10. 2025

Google: Gemini 2.5 Flash Image (Nano Banana)

google/gemini-2.5-flash-image

Generování obrázků Konverzační AI

💰

Vstup

$0.3/1M

📤

Výstup

$2.5/1M

📏

Kontext

32768

📝

Max výstup

32768

Vstup: image text → Výstup: image text

💪 Silné stránky

Cena Relativně nízká cena ve srovnání s jinými multimodálními modely.

Multimodalita Schopnost zpracovávat a generovat obrázky i text.

⚠️ Slabé stránky

Benchmarky Benchmark data nejsou k dispozici, nelze objektivně posoudit výkon.

Kontext Relativně malý kontext (32,768 tokenů) ve srovnání s textovými modely.

Expertní hodnocení

🎯

Killer Feature

Nízká cena pro generování obrázků s kontextovým porozuměním.

⚡

Skryté riziko

Chybějící benchmark data znemožňují objektivní posouzení kvality generovaných obrázků a porozumění češtině.

✅

Doporučený scénář

Rychlé generování obrázků pro interní použití nebo pro prototypování.

Gemini 2.5 Flash Image, známý také jako “Nano Banana,” je nyní obecně dostupný. Jedná se o nejmodernější model pro generování obrázků s kontextuálním porozuměním. Je schopen generovat obrázky, provádět úpravy a vést vícekolové konverzace. Poměry stran lze ovládat pomocí parametru API image_config

Unikátní charakteristiky

Gemini 2.5 Flash Image je model pro generování obrázků s kontextovým porozuměním. Umožňuje editaci obrázků a vícekolové konverzace. Podpora nastavení poměru stran pomocí API.

Silné stránky

Cena

Relativně nízká cena ve srovnání s jinými multimodálními modely.

Multimodalita

Schopnost zpracovávat a generovat obrázky i text.

Slabé stránky

Benchmarky

Benchmark data nejsou k dispozici, nelze objektivně posoudit výkon.

Kontext

Relativně malý kontext (32,768 tokenů) ve srovnání s textovými modely.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5

16x dražší vstup, 10x dražší výstup

Claude Opus je textový model s větším kontextem, vhodný pro náročnější textové úlohy. Gemini 2.5 Flash Image je zaměřen na obrázky.

GOOGLE google/gemini-3-pro-image-preview

6.6x dražší vstup, 4.8x dražší výstup

Gemini 3 Pro Image Preview má větší kontext, ale je dražší.

OPENAI openai/gpt-5.1

4.1x dražší vstup, 4x dražší výstup

GPT-5.1 je textový model s větším kontextem, vhodný pro náročnější textové úlohy. Gemini 2.5 Flash Image je zaměřen na obrázky.

MISTRALAI mistralai/ministral-14b-2512

O něco levnější vstup i výstup

Ministral-14b-2512 je textový model s velkým kontextem, vhodný pro textové úlohy. Gemini 2.5 Flash Image je zaměřen na obrázky.

Doporučení

Cílová skupina

Tvůrci obsahu
Marketingoví specialisté
Vývojáři aplikací

Vhodné pro

Generování obrázků pro sociální média
Vytváření vizuálů pro prezentace
Vývoj aplikací s vizuálním obsahem

Nevhodné pro

Náročné textové úlohy
Aplikace vyžadující extrémně dlouhý kontext
Kritické aplikace vyžadující vysokou přesnost a spolehlivost

Verdikt

Gemini 2.5 Flash Image je vhodný pro uživatele, kteří hledají cenově dostupný model pro generování obrázků, ale měli by být opatrní kvůli chybějícím benchmarkům a potenciálním omezením v kvalitě a porozumění češtině.