Openai

OpenAI: GPT-5

openai/gpt-5
Věda Programování Agenti
78 /100
Výborný
💰
Vstup
$1.25/1M
📤
Výstup
$10.0/1M
📏
Kontext
400000
📝
Max výstup
128000
Vstup: text image file Výstup: text

💪 Silné stránky

Věda a matematika Excelentní výsledky v matematických benchmarkách MATH-500 (99.4%) a AIME 2025 (95.7%) ukazují na silné schopnosti v řešení složitých problémů.
Programování Vysoké skóre v LiveCodeBench (84.6%) naznačuje dobrou kvalitu generovaného kódu a schopnost řešit programátorské úlohy.

⚠️ Slabé stránky

Rychlost Vysoká latence (80.218s) a nízké TPS (108.0) omezují použitelnost v aplikacích vyžadujících rychlou odezvu.
Jazykové schopnosti (Čeština) Data pro češtinu (MMMLU) nejsou k dispozici, což znemožňuje posoudit kvalitu modelu v českém jazyce.

Hodnocení podle kategorií

🧮
Věda & Matematika
92.3
Excelentní
💻
Programování
84.6
Výborný
🤖
Agenti & Nástroje
84.8
Výborný
🧠
Obecná inteligence
64.4
Dobrý
Rychlost
27.0
Slabý

Expertní hodnocení

🎯
Killer Feature
Excelentní matematické schopnosti
Skryté riziko
Pomalá inference může omezit použitelnost v interaktivních aplikacích
Doporučený scénář
Řešení složitých matematických a vědeckých problémů, kde je kladen důraz na přesnost a ne na rychlost

GPT-5 je nejpokročilejší model od OpenAI, který nabízí zásadní vylepšení v usuzování, kvalitě kódu a uživatelské zkušenosti. Je optimalizován pro komplexní úlohy, které vyžadují postupné usuzování, dodržování instrukcí a přesnost v kritických případech použití. Podporuje funkce směrování za běhu (test-time routing) a pokročilé porozumění promptům, včetně uživatelsky specifikovaného záměru, jako například “důkladně o tom přemýšlej”. Vylepšení zahrnují snížení halucinací, podlézavosti a lepší výkon v kódování, psaní a úlohách souvisejících se zdravotnictvím.

Unikátní charakteristiky

GPT-5 vyniká v komplexních úlohách vyžadujících postupné uvažování a přesnost. Dosahuje vysokých skóre v matematických a vědeckých benchmarkách, což naznačuje silné schopnosti v těchto oblastech. Nicméně, latence je relativně vysoká, což může omezit jeho použitelnost v aplikacích vyžadujících rychlou odezvu.

Silné stránky

Věda a matematika

Excelentní výsledky v matematických benchmarkách MATH-500 (99.4%) a AIME 2025 (95.7%) ukazují na silné schopnosti v řešení složitých problémů.

Programování

Vysoké skóre v LiveCodeBench (84.6%) naznačuje dobrou kvalitu generovaného kódu a schopnost řešit programátorské úlohy.

Slabé stránky

Rychlost

Vysoká latence (80.218s) a nízké TPS (108.0) omezují použitelnost v aplikacích vyžadujících rychlou odezvu.

Jazykové schopnosti (Čeština)

Data pro češtinu (MMMLU) nejsou k dispozici, což znemožňuje posoudit kvalitu modelu v českém jazyce.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5
4x dražší vstup, 2.5x dražší výstup

Claude Opus je dražší, ale může nabízet srovnatelné nebo lepší výsledky v některých oblastech. Nutno otestovat pro konkrétní use case.

GOOGLE google/gemini-3-pro-preview
1.6x dražší vstup, 1.2x dražší výstup

Gemini Pro má větší kontext, ale je dražší. Může být vhodný pro úlohy vyžadující rozsáhlý kontext.

X-AI x-ai/grok-4.1-fast
6.25x levnější vstup, 20x levnější výstup

Grok je výrazně levnější, ale pravděpodobně dosahuje horších výsledků v náročnějších úlohách. Vhodný pro nenáročné aplikace.

MISTRALAI mistralai/ministral-14b-2512
6.25x levnější vstup, 50x levnější výstup

Mistral je velmi levný, ale může mít omezené schopnosti v komplexních úlohách. Vhodný pro prototypování a experimentování.

Doporučení

Cílová skupina

  • Výzkumníci
  • Vývojáři
  • Finanční analytici

Vhodné pro

  • Řešení matematických problémů
  • Generování kódu
  • Analýza dat

Nevhodné pro

  • Aplikace s nízkou latencí
  • Úlohy vyžadující rozsáhlou znalost češtiny

Verdikt

GPT-5 je vhodný pro uživatele, kteří potřebují vysokou přesnost a kvalitu v matematických, vědeckých a programátorských úlohách a nevadí jim vyšší cena a latence.