Openai 07. 08. 2025

OpenAI: GPT-5

openai/gpt-5

Věda Programování Agenti

78 /100

Výborný

💰

Vstup

$1.25/1M

📤

Výstup

$10.0/1M

📏

Kontext

400000

📝

Max výstup

128000

Vstup: text image file → Výstup: text

💪 Silné stránky

Věda a matematika Excelentní výsledky v matematických benchmarkách MATH-500 (99.4%) a AIME 2025 (95.7%) ukazují na silné schopnosti v řešení složitých problémů.

Programování Vysoké skóre v LiveCodeBench (84.6%) naznačuje dobrou kvalitu generovaného kódu a schopnost řešit programátorské úlohy.

⚠️ Slabé stránky

Rychlost Vysoká latence (80.218s) a nízké TPS (108.0) omezují použitelnost v aplikacích vyžadujících rychlou odezvu.

Jazykové schopnosti (Čeština) Data pro češtinu (MMMLU) nejsou k dispozici, což znemožňuje posoudit kvalitu modelu v českém jazyce.

Hodnocení podle kategorií

🧮

Věda & Matematika

92.3

Excelentní

💻

Programování

84.6

Výborný

🤖

Agenti & Nástroje

84.8

Výborný

🧠

Obecná inteligence

64.4

Dobrý

⚡

Rychlost

27.0

Slabý

Expertní hodnocení

🎯

Killer Feature

Excelentní matematické schopnosti

⚡

Skryté riziko

Pomalá inference může omezit použitelnost v interaktivních aplikacích

✅

Doporučený scénář

Řešení složitých matematických a vědeckých problémů, kde je kladen důraz na přesnost a ne na rychlost

GPT-5 je nejpokročilejší model od OpenAI, který nabízí zásadní vylepšení v usuzování, kvalitě kódu a uživatelské zkušenosti. Je optimalizován pro komplexní úlohy, které vyžadují postupné usuzování, dodržování instrukcí a přesnost v kritických případech použití. Podporuje funkce směrování za běhu (test-time routing) a pokročilé porozumění promptům, včetně uživatelsky specifikovaného záměru, jako například “důkladně o tom přemýšlej”. Vylepšení zahrnují snížení halucinací, podlézavosti a lepší výkon v kódování, psaní a úlohách souvisejících se zdravotnictvím.

Unikátní charakteristiky

GPT-5 vyniká v komplexních úlohách vyžadujících postupné uvažování a přesnost. Dosahuje vysokých skóre v matematických a vědeckých benchmarkách, což naznačuje silné schopnosti v těchto oblastech. Nicméně, latence je relativně vysoká, což může omezit jeho použitelnost v aplikacích vyžadujících rychlou odezvu.

Silné stránky

Věda a matematika

Excelentní výsledky v matematických benchmarkách MATH-500 (99.4%) a AIME 2025 (95.7%) ukazují na silné schopnosti v řešení složitých problémů.

Programování

Vysoké skóre v LiveCodeBench (84.6%) naznačuje dobrou kvalitu generovaného kódu a schopnost řešit programátorské úlohy.

Slabé stránky

Rychlost

Vysoká latence (80.218s) a nízké TPS (108.0) omezují použitelnost v aplikacích vyžadujících rychlou odezvu.

Jazykové schopnosti (Čeština)

Data pro češtinu (MMMLU) nejsou k dispozici, což znemožňuje posoudit kvalitu modelu v českém jazyce.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5

4x dražší vstup, 2.5x dražší výstup

Claude Opus je dražší, ale může nabízet srovnatelné nebo lepší výsledky v některých oblastech. Nutno otestovat pro konkrétní use case.

GOOGLE google/gemini-3-pro-preview

1.6x dražší vstup, 1.2x dražší výstup

Gemini Pro má větší kontext, ale je dražší. Může být vhodný pro úlohy vyžadující rozsáhlý kontext.

X-AI x-ai/grok-4.1-fast

6.25x levnější vstup, 20x levnější výstup

Grok je výrazně levnější, ale pravděpodobně dosahuje horších výsledků v náročnějších úlohách. Vhodný pro nenáročné aplikace.

MISTRALAI mistralai/ministral-14b-2512

6.25x levnější vstup, 50x levnější výstup

Mistral je velmi levný, ale může mít omezené schopnosti v komplexních úlohách. Vhodný pro prototypování a experimentování.

Doporučení

Cílová skupina

Výzkumníci
Vývojáři
Finanční analytici

Vhodné pro

Řešení matematických problémů
Generování kódu
Analýza dat

Nevhodné pro

Aplikace s nízkou latencí
Úlohy vyžadující rozsáhlou znalost češtiny

Verdikt

GPT-5 je vhodný pro uživatele, kteří potřebují vysokou přesnost a kvalitu v matematických, vědeckých a programátorských úlohách a nevadí jim vyšší cena a latence.