Openai 31. 01. 2025

OpenAI: o3 Mini

openai/o3-mini

Věda Matematika Programování

57 /100

Průměrný

💰

Vstup

$1.1/1M

📤

Výstup

$4.4/1M

📏

Kontext

200000

📝

Max výstup

100000

Vstup: text file → Výstup: text

💪 Silné stránky

Matematika Vynikající výsledky v matematických úlohách, dosahuje 97.3% v MATH-500 a 77.0% v AIME 2025.

Programování Solidní výkon v kódování s LiveCodeBench skóre 71.7%.

Vědecké úlohy Dobré výsledky ve vědeckých úlohách, GPQA Diamond skóre 74.8%.

⚠️ Slabé stránky

Rychlost Nízká rychlost zpracování, TPS 140.1 a TTFT 18.052s, což je pomalé.

Agenti a nástroje Slabý výkon v úlohách agentů, τ2-Bench skóre pouze 28.7%.

Čeština Data pro češtinu nejsou k dispozici, nelze posoudit kvalitu v českém jazyce.

Hodnocení podle kategorií

🧮

Věda & Matematika

80.2

Výborný

💻

Programování

71.7

Dobrý

🤖

Agenti & Nástroje

28.7

Slabý

🧠

Obecná inteligence

52.7

Průměrný

⚡

Rychlost

35.0

Slabý

Expertní hodnocení

🎯

Killer Feature

Vynikající v matematických úlohách

⚡

Skryté riziko

Pomalá inference může být problém pro interaktivní aplikace

✅

Doporučený scénář

Řešení komplexních matematických problémů a generování kódu pro vědecké výpočty.

OpenAI o3-mini je nákladově efektivní jazykový model optimalizovaný pro úlohy STEM uvažování, obzvláště vynikající ve vědě, matematice a programování.

Tento model podporuje parametr reasoning_effort, který lze nastavit na “high”, “medium” nebo “low” pro řízení doby přemýšlení modelu. Výchozí hodnota je “medium”. OpenRouter také nabízí model slug openai/o3-mini-high pro nastavení parametru na “high” jako výchozí.

Model nabízí tři nastavitelné úrovně úsilí uvažování a podporuje klíčové vývojářské schopnosti včetně volání funkcí, strukturovaných výstupů a streamování, i když nezahrnuje schopnosti zpracování obrazu.

Model vykazuje významné zlepšení oproti svému předchůdci, přičemž odborní testeři preferovali jeho odpovědi v 56 % případů a zaznamenali 39% snížení závažných chyb u složitých otázek. S nastavením středního úsilí uvažování (medium reasoning effort), o3-mini dosahuje výkonu většího modelu o1 v náročných hodnoceních uvažování, jako jsou AIME a GPQA, při zachování nižší latence a nákladů.

Unikátní charakteristiky

OpenAI o3-mini je nákladově efektivní jazykový model optimalizovaný pro STEM úlohy, vyniká ve vědě, matematice a kódování. Podporuje tři nastavitelné úrovně usuzování a klíčové vývojářské funkce, jako je volání funkcí a strukturované výstupy.

Silné stránky

Matematika

Vynikající výsledky v matematických úlohách, dosahuje 97.3% v MATH-500 a 77.0% v AIME 2025.

Programování

Solidní výkon v kódování s LiveCodeBench skóre 71.7%.

Vědecké úlohy

Dobré výsledky ve vědeckých úlohách, GPQA Diamond skóre 74.8%.

Slabé stránky

Rychlost

Nízká rychlost zpracování, TPS 140.1 a TTFT 18.052s, což je pomalé.

Agenti a nástroje

Slabý výkon v úlohách agentů, τ2-Bench skóre pouze 28.7%.

Čeština

Data pro češtinu nejsou k dispozici, nelze posoudit kvalitu v českém jazyce.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-haiku-4.5

Podobná cena vstupu, dražší výstup

Claude Haiku je rychlejší, ale o3-mini má lepší výsledky v matematice a programování.

GOOGLE google/gemini-2.5-flash-image

Mnohem levnější vstup i výstup

Gemini 2.5 Flash je výrazně levnější, ale pravděpodobně méně výkonný v náročných úlohách STEM.

MISTRALAI mistralai/ministral-8b-2512

Mnohem levnější vstup i výstup

Mistral 8B je výrazně levnější, ale o3-mini má lepší výsledky v matematice a programování.

DEEPSEEK deepseek/deepseek-v3.2

Levnější vstup i výstup

Deepseek v3.2 je levnější, ale o3-mini má lepší výsledky v matematice.

Doporučení

Cílová skupina

Studenti
Výzkumníci
Vývojáři

Vhodné pro

Řešení matematických úloh
Generování kódu
Vědecké výpočty

Nevhodné pro

Úlohy vyžadující rychlou odezvu
Úlohy agentů
Aplikace v češtině (bez testování)

Verdikt

OpenAI o3-mini je dobrá volba pro uživatele, kteří potřebují řešit matematické a vědecké úlohy a nevadí jim pomalejší odezva. Je vhodný pro studenty, výzkumníky a vývojáře v oblasti STEM.