Openai 16. 04. 2025

OpenAI: o4 Mini

openai/o4-mini

Věda a matematika Programování

70 /100

Dobrý

💰

Vstup

$1.1/1M

📤

Výstup

$4.4/1M

📏

Kontext

200000

📝

Max výstup

100000

Vstup: image text file → Výstup: text

💪 Silné stránky

Věda a matematika Model dosahuje vynikajících výsledků v matematických úlohách, s benchmarky jako MATH-500 (98.9%) a AIME 2025 (94.0%).

Programování Vysoké skóre v LiveCodeBench (85.9%) naznačuje silné schopnosti v oblasti kódování a řešení programovacích úloh.

⚠️ Slabé stránky

Rychlost Model má slabou rychlost inference, s TPS 107.9 a TTFT 65.881s, což ho činí pomalejším než konkurenční modely.

Čeština Chybí data pro hodnocení výkonu v češtině (MMMLU), což omezuje jeho použitelnost pro české uživatele.

Hodnocení podle kategorií

🧮

Věda & Matematika

88.7

Výborný

💻

Programování

85.9

Výborný

🤖

Agenti & Nástroje

55.6

Průměrný

🧠

Obecná inteligence

58.6

Průměrný

⚡

Rychlost

27.0

Slabý

Expertní hodnocení

🎯

Killer Feature

Vynikající matematické schopnosti

⚡

Skryté riziko

Pomalá inference a nedostatečná podpora češtiny

✅

Doporučený scénář

Řešení komplexních matematických úloh a generování kódu v angličtině

OpenAI o4-mini je kompaktní model pro usuzování v o-sérii, optimalizovaný pro rychlý a nákladově efektivní výkon při zachování silných multimodálních a agentních schopností. Podporuje používání nástrojů a vykazuje konkurenceschopný výkon v usuzování a kódování v benchmarkách jako AIME (99,5 % s Pythonem) a SWE-bench, překonává svého předchůdce o3-mini a v některých oblastech se dokonce blíží o3.

Navzdory své menší velikosti vykazuje o4-mini vysokou přesnost v úlohách STEM, vizuálním řešení problémů (např. MathVista, MMMU) a úpravách kódu. Je obzvláště vhodný pro scénáře s vysokou propustností, kde je latence nebo cena kritická. Díky své efektivní architektuře a vylepšenému tréninku pomocí posilování se o4-mini dokáže řetězit nástroje, generovat strukturované výstupy a řešit vícestupňové úlohy s minimálním zpožděním – často i za méně než minutu.

Unikátní charakteristiky

OpenAI o4-mini je optimalizovaný pro rychlost a efektivitu nákladů, přičemž si zachovává silné multimodální a agentní schopnosti. Vyniká ve STEM úlohách a kódování, jak dokazují benchmarky AIME a LiveCodeBench.

Silné stránky

Věda a matematika

Model dosahuje vynikajících výsledků v matematických úlohách, s benchmarky jako MATH-500 (98.9%) a AIME 2025 (94.0%).

Programování

Vysoké skóre v LiveCodeBench (85.9%) naznačuje silné schopnosti v oblasti kódování a řešení programovacích úloh.

Slabé stránky

Rychlost

Model má slabou rychlost inference, s TPS 107.9 a TTFT 65.881s, což ho činí pomalejším než konkurenční modely.

Čeština

Chybí data pro hodnocení výkonu v češtině (MMMLU), což omezuje jeho použitelnost pro české uživatele.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-haiku-4.5

Podobná cena vstupu, vyšší cena výstupu

Claude Haiku je rychlejší, ale o4-mini má lepší matematické schopnosti.

GOOGLE google/gemini-2.5-flash-image

Mnohem levnější vstup i výstup

Gemini 2.5 Flash je výrazně levnější, ale o4-mini má lepší výsledky v náročnějších úlohách.

MISTRALAI mistralai/ministral-8b-2512

Mnohem levnější vstup i výstup

Mistral 8B je levnější, ale o4-mini má lepší výsledky v matematice a kódování.

DEEPSEEK deepseek/deepseek-v3.2

Levnější vstup i výstup

Deepseek V3.2 je levnější, ale o4-mini má větší kontextové okno a lepší výsledky v některých benchmarkách.

Doporučení

Cílová skupina

Výzkumníci
Vývojáři aplikací

Vhodné pro

Řešení matematických problémů
Generování kódu

Nevhodné pro

Aplikace vyžadující nízkou latenci
Použití v češtině

Verdikt

OpenAI o4-mini je vhodný pro uživatele, kteří potřebují silný model pro matematické a programovací úlohy a nevadí jim pomalejší rychlost a absence podpory češtiny.