OpenAI: o3 Mini
openai/o3-mini
💪 Silné stránky
⚠️ Slabé stránky
Hodnocení podle kategorií
Expertní hodnocení
OpenAI o3-mini je nákladově efektivní jazykový model optimalizovaný pro úlohy STEM uvažování, obzvláště vynikající ve vědě, matematice a programování.
Tento model podporuje parametr reasoning_effort, který lze nastavit na “high”, “medium” nebo “low” pro řízení doby přemýšlení modelu. Výchozí hodnota je “medium”. OpenRouter také nabízí model slug openai/o3-mini-high pro nastavení parametru na “high” jako výchozí.
Model nabízí tři nastavitelné úrovně úsilí uvažování a podporuje klíčové vývojářské schopnosti včetně volání funkcí, strukturovaných výstupů a streamování, i když nezahrnuje schopnosti zpracování obrazu.
Model vykazuje významné zlepšení oproti svému předchůdci, přičemž odborní testeři preferovali jeho odpovědi v 56 % případů a zaznamenali 39% snížení závažných chyb u složitých otázek. S nastavením středního úsilí uvažování (medium reasoning effort), o3-mini dosahuje výkonu většího modelu o1 v náročných hodnoceních uvažování, jako jsou AIME a GPQA, při zachování nižší latence a nákladů.
Unikátní charakteristiky
OpenAI o3-mini je nákladově efektivní jazykový model optimalizovaný pro STEM úlohy, vyniká ve vědě, matematice a kódování. Podporuje tři nastavitelné úrovně usuzování a klíčové vývojářské funkce, jako je volání funkcí a strukturované výstupy.
Silné stránky
Matematika
Vynikající výsledky v matematických úlohách, dosahuje 97.3% v MATH-500 a 77.0% v AIME 2025.
Programování
Solidní výkon v kódování s LiveCodeBench skóre 71.7%.
Vědecké úlohy
Dobré výsledky ve vědeckých úlohách, GPQA Diamond skóre 74.8%.
Slabé stránky
Rychlost
Nízká rychlost zpracování, TPS 140.1 a TTFT 18.052s, což je pomalé.
Agenti a nástroje
Slabý výkon v úlohách agentů, τ2-Bench skóre pouze 28.7%.
Čeština
Data pro češtinu nejsou k dispozici, nelze posoudit kvalitu v českém jazyce.
Srovnání s konkurencí
Claude Haiku je rychlejší, ale o3-mini má lepší výsledky v matematice a programování.
Gemini 2.5 Flash je výrazně levnější, ale pravděpodobně méně výkonný v náročných úlohách STEM.
Mistral 8B je výrazně levnější, ale o3-mini má lepší výsledky v matematice a programování.
Deepseek v3.2 je levnější, ale o3-mini má lepší výsledky v matematice.
Doporučení
Cílová skupina
- Studenti
- Výzkumníci
- Vývojáři
Vhodné pro
- Řešení matematických úloh
- Generování kódu
- Vědecké výpočty
Nevhodné pro
- Úlohy vyžadující rychlou odezvu
- Úlohy agentů
- Aplikace v češtině (bez testování)
Verdikt
OpenAI o3-mini je dobrá volba pro uživatele, kteří potřebují řešit matematické a vědecké úlohy a nevadí jim pomalejší odezva. Je vhodný pro studenty, výzkumníky a vývojáře v oblasti STEM.