Openai 16. 10. 2025

OpenAI: GPT-5 Image Mini

openai/gpt-5-image-mini

Generování obrázků Multimodální zpracování

💰

Vstup

$2.5/1M

📤

Výstup

$2.0/1M

📏

Kontext

400000

📝

Max výstup

128000

Vstup: file image text → Výstup: image text

💪 Silné stránky

Multimodální schopnosti Nativně multimodální model, který kombinuje textové a obrazové vstupy a výstupy.

Cena Relativně nízká cena ve srovnání s jinými multimodálními modely, blend cena $2.38/1M tokenů.

⚠️ Slabé stránky

Nedostatek benchmarků Chybí benchmark data pro objektivní srovnání výkonu s konkurencí.

Neznámá kvalita češtiny Není známa kvalita zpracování češtiny, což je kritické pro lokální nasazení (chybí MMMLU skóre).

Expertní hodnocení

🎯

Killer Feature

Efektivní generování obrázků s textovým porozuměním za rozumnou cenu.

⚡

Skryté riziko

Neznámá kvalita češtiny a nedostatek benchmark dat pro objektivní srovnání.

✅

Doporučený scénář

Rychlé generování vizuálního obsahu pro marketingové kampaně a sociální média.

GPT-5 Image Mini kombinuje pokročilé jazykové schopnosti OpenAI, poháněné GPT-5 Mini, s GPT Image 1 Mini pro efektivní generování obrázků. Tento nativně multimodální model se vyznačuje vynikajícím dodržováním instrukcí, vykreslováním textu a detailní úpravou obrázků se sníženou latencí a náklady. Vyniká ve vysoce kvalitní vizuální tvorbě při zachování silného porozumění textu, což ho činí ideálním pro aplikace, které vyžadují efektivní generování obrázků a zpracování textu ve velkém měřítku.

Unikátní charakteristiky

GPT-5 Image Mini kombinuje pokročilé jazykové schopnosti s generováním obrázků. Model je navržen pro efektivní generování obrázků s důrazem na detail a textové porozumění. Benchmark data nejsou k dispozici.

Silné stránky

Multimodální schopnosti

Nativně multimodální model, který kombinuje textové a obrazové vstupy a výstupy.

Cena

Relativně nízká cena ve srovnání s jinými multimodálními modely, blend cena $2.38/1M tokenů.

Slabé stránky

Nedostatek benchmarků

Chybí benchmark data pro objektivní srovnání výkonu s konkurencí.

Neznámá kvalita češtiny

Není známa kvalita zpracování češtiny, což je kritické pro lokální nasazení (chybí MMMLU skóre).

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5

2x dražší vstup, 12.5x dražší výstup

Claude Opus 4.5 je silnější jazykový model, ale dražší. Konkuruje v kvalitě výstupu.

GOOGLE google/gemini-3-pro-image-preview

Podobná cena vstupu, 6x dražší výstup

Gemini 3 Pro Image Preview konkuruje v multimodálních schopnostech, ale má menší kontext.

OPENAI openai/gpt-5.1

Poloviční cena vstupu, 5x dražší výstup

GPT-5.1 je silný jazykový model, ale není nativně multimodální.

GOOGLE google/gemini-2.5-flash-image

8x levnější vstup, 1.25x dražší výstup

Gemini 2.5 Flash Image je levnější, ale má menší kontext a může mít nižší kvalitu výstupu.

Doporučení

Cílová skupina

Marketingové týmy
Tvůrci obsahu
Vývojáři aplikací s vizuálními prvky

Vhodné pro

Generování obrázků pro sociální média
Vytváření vizuálních konceptů
Automatické generování grafiky

Nevhodné pro

Aplikace vyžadující extrémní přesnost a detail
Kritické aplikace s vysokými nároky na bezpečnost

Verdikt

GPT-5 Image Mini je vhodný pro uživatele, kteří hledají efektivní a cenově dostupný způsob generování obrázků s textovým porozuměním, ale měli by být opatrní kvůli nedostatku benchmark dat a neznámé kvalitě češtiny.