Openai

OpenAI: o3 Mini

openai/o3-mini
Věda Matematika Programování
57 /100
Průměrný
💰
Vstup
$1.1/1M
📤
Výstup
$4.4/1M
📏
Kontext
200000
📝
Max výstup
100000
Vstup: text file Výstup: text

💪 Silné stránky

Matematika Vynikající výsledky v matematických úlohách, dosahuje 97.3% v MATH-500 a 77.0% v AIME 2025.
Programování Solidní výkon v kódování s LiveCodeBench skóre 71.7%.
Vědecké úlohy Dobré výsledky ve vědeckých úlohách, GPQA Diamond skóre 74.8%.

⚠️ Slabé stránky

Rychlost Nízká rychlost zpracování, TPS 140.1 a TTFT 18.052s, což je pomalé.
Agenti a nástroje Slabý výkon v úlohách agentů, τ2-Bench skóre pouze 28.7%.
Čeština Data pro češtinu nejsou k dispozici, nelze posoudit kvalitu v českém jazyce.

Hodnocení podle kategorií

🧮
Věda & Matematika
80.2
Výborný
💻
Programování
71.7
Dobrý
🤖
Agenti & Nástroje
28.7
Slabý
🧠
Obecná inteligence
52.7
Průměrný
Rychlost
35.0
Slabý

Expertní hodnocení

🎯
Killer Feature
Vynikající v matematických úlohách
Skryté riziko
Pomalá inference může být problém pro interaktivní aplikace
Doporučený scénář
Řešení komplexních matematických problémů a generování kódu pro vědecké výpočty.

OpenAI o3-mini je nákladově efektivní jazykový model optimalizovaný pro úlohy STEM uvažování, obzvláště vynikající ve vědě, matematice a programování.

Tento model podporuje parametr reasoning_effort, který lze nastavit na “high”, “medium” nebo “low” pro řízení doby přemýšlení modelu. Výchozí hodnota je “medium”. OpenRouter také nabízí model slug openai/o3-mini-high pro nastavení parametru na “high” jako výchozí.

Model nabízí tři nastavitelné úrovně úsilí uvažování a podporuje klíčové vývojářské schopnosti včetně volání funkcí, strukturovaných výstupů a streamování, i když nezahrnuje schopnosti zpracování obrazu.

Model vykazuje významné zlepšení oproti svému předchůdci, přičemž odborní testeři preferovali jeho odpovědi v 56 % případů a zaznamenali 39% snížení závažných chyb u složitých otázek. S nastavením středního úsilí uvažování (medium reasoning effort), o3-mini dosahuje výkonu většího modelu o1 v náročných hodnoceních uvažování, jako jsou AIME a GPQA, při zachování nižší latence a nákladů.

Unikátní charakteristiky

OpenAI o3-mini je nákladově efektivní jazykový model optimalizovaný pro STEM úlohy, vyniká ve vědě, matematice a kódování. Podporuje tři nastavitelné úrovně usuzování a klíčové vývojářské funkce, jako je volání funkcí a strukturované výstupy.

Silné stránky

Matematika

Vynikající výsledky v matematických úlohách, dosahuje 97.3% v MATH-500 a 77.0% v AIME 2025.

Programování

Solidní výkon v kódování s LiveCodeBench skóre 71.7%.

Vědecké úlohy

Dobré výsledky ve vědeckých úlohách, GPQA Diamond skóre 74.8%.

Slabé stránky

Rychlost

Nízká rychlost zpracování, TPS 140.1 a TTFT 18.052s, což je pomalé.

Agenti a nástroje

Slabý výkon v úlohách agentů, τ2-Bench skóre pouze 28.7%.

Čeština

Data pro češtinu nejsou k dispozici, nelze posoudit kvalitu v českém jazyce.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-haiku-4.5
Podobná cena vstupu, dražší výstup

Claude Haiku je rychlejší, ale o3-mini má lepší výsledky v matematice a programování.

GOOGLE google/gemini-2.5-flash-image
Mnohem levnější vstup i výstup

Gemini 2.5 Flash je výrazně levnější, ale pravděpodobně méně výkonný v náročných úlohách STEM.

MISTRALAI mistralai/ministral-8b-2512
Mnohem levnější vstup i výstup

Mistral 8B je výrazně levnější, ale o3-mini má lepší výsledky v matematice a programování.

DEEPSEEK deepseek/deepseek-v3.2
Levnější vstup i výstup

Deepseek v3.2 je levnější, ale o3-mini má lepší výsledky v matematice.

Doporučení

Cílová skupina

  • Studenti
  • Výzkumníci
  • Vývojáři

Vhodné pro

  • Řešení matematických úloh
  • Generování kódu
  • Vědecké výpočty

Nevhodné pro

  • Úlohy vyžadující rychlou odezvu
  • Úlohy agentů
  • Aplikace v češtině (bez testování)

Verdikt

OpenAI o3-mini je dobrá volba pro uživatele, kteří potřebují řešit matematické a vědecké úlohy a nevadí jim pomalejší odezva. Je vhodný pro studenty, výzkumníky a vývojáře v oblasti STEM.