OpenAI: GPT-5
openai/gpt-5
💪 Silné stránky
⚠️ Slabé stránky
Hodnocení podle kategorií
Expertní hodnocení
GPT-5 je nejpokročilejší model od OpenAI, který nabízí zásadní vylepšení v usuzování, kvalitě kódu a uživatelské zkušenosti. Je optimalizován pro komplexní úlohy, které vyžadují postupné usuzování, dodržování instrukcí a přesnost v kritických případech použití. Podporuje funkce směrování za běhu (test-time routing) a pokročilé porozumění promptům, včetně uživatelsky specifikovaného záměru, jako například “důkladně o tom přemýšlej”. Vylepšení zahrnují snížení halucinací, podlézavosti a lepší výkon v kódování, psaní a úlohách souvisejících se zdravotnictvím.
Unikátní charakteristiky
GPT-5 vyniká v komplexních úlohách vyžadujících postupné uvažování a přesnost. Dosahuje vysokých skóre v matematických a vědeckých benchmarkách, což naznačuje silné schopnosti v těchto oblastech. Nicméně, latence je relativně vysoká, což může omezit jeho použitelnost v aplikacích vyžadujících rychlou odezvu.
Silné stránky
Věda a matematika
Excelentní výsledky v matematických benchmarkách MATH-500 (99.4%) a AIME 2025 (95.7%) ukazují na silné schopnosti v řešení složitých problémů.
Programování
Vysoké skóre v LiveCodeBench (84.6%) naznačuje dobrou kvalitu generovaného kódu a schopnost řešit programátorské úlohy.
Slabé stránky
Rychlost
Vysoká latence (80.218s) a nízké TPS (108.0) omezují použitelnost v aplikacích vyžadujících rychlou odezvu.
Jazykové schopnosti (Čeština)
Data pro češtinu (MMMLU) nejsou k dispozici, což znemožňuje posoudit kvalitu modelu v českém jazyce.
Srovnání s konkurencí
Claude Opus je dražší, ale může nabízet srovnatelné nebo lepší výsledky v některých oblastech. Nutno otestovat pro konkrétní use case.
Gemini Pro má větší kontext, ale je dražší. Může být vhodný pro úlohy vyžadující rozsáhlý kontext.
Grok je výrazně levnější, ale pravděpodobně dosahuje horších výsledků v náročnějších úlohách. Vhodný pro nenáročné aplikace.
Mistral je velmi levný, ale může mít omezené schopnosti v komplexních úlohách. Vhodný pro prototypování a experimentování.
Doporučení
Cílová skupina
- Výzkumníci
- Vývojáři
- Finanční analytici
Vhodné pro
- Řešení matematických problémů
- Generování kódu
- Analýza dat
Nevhodné pro
- Aplikace s nízkou latencí
- Úlohy vyžadující rozsáhlou znalost češtiny
Verdikt
GPT-5 je vhodný pro uživatele, kteří potřebují vysokou přesnost a kvalitu v matematických, vědeckých a programátorských úlohách a nevadí jim vyšší cena a latence.