Openai 23. 09. 2025

OpenAI: GPT-5 Codex

openai/gpt-5-codex

Programování Řešení matematických problémů

79 /100

Výborný

💰

Vstup

$1.25/1M

📤

Výstup

$10.0/1M

📏

Kontext

400000

📝

Max výstup

128000

Vstup: text image → Výstup: text

💪 Silné stránky

Programování Vysoké skóre v LiveCodeBench (84.0) naznačuje silné schopnosti v generování a porozumění kódu.

Matematika Výborné výsledky v aime_25 (98.7) a artificial_analysis_math_index (98.7) ukazují na silné matematické dovednosti.

⚠️ Slabé stránky

Rychlost Relativně nízké TPS (210.8) a vysoká latence (21.908s) znamenají pomalejší odezvu v porovnání s konkurencí.

Čeština Nedostupnost dat pro MMMLU v češtině znemožňuje posoudit kvalitu modelu v českém jazyce.

Hodnocení podle kategorií

🧮

Věda & Matematika

83.7

Výborný

💻

Programování

84.0

Výborný

🤖

Agenti & Nástroje

86.8

Výborný

🧠

Obecná inteligence

63.7

Dobrý

⚡

Rychlost

50.0

Průměrný

Expertní hodnocení

🎯

Killer Feature

Vynikající schopnosti v matematice a programování.

⚡

Skryté riziko

Vyšší latence a neznámá kvalita v češtině.

✅

Doporučený scénář

Automatické generování a refaktorování kódu v anglickém jazyce.

GPT-5-Codex je specializovaná verze GPT-5 optimalizovaná pro softwarové inženýrství a pracovní postupy kódování. Je navržena jak pro interaktivní vývojové relace, tak pro dlouhé, nezávislé provádění komplexních inženýrských úloh. Model podporuje vytváření projektů od začátku, vývoj funkcí, ladění, rozsáhlý refaktoring a revizi kódu. Ve srovnání s GPT-5 je Codex lépe řiditelný, úzce se drží pokynů vývojáře a produkuje čistší a kvalitnější výstupy kódu. Úsilí vynaložené na usuzování lze upravit pomocí parametru reasoning.effort. Přečtěte si dokumentaci zde

Codex se integruje do vývojářských prostředí, včetně CLI, rozšíření IDE, GitHubu a cloudových úloh. Dynamicky přizpůsobuje úsilí vynaložené na usuzování – poskytuje rychlé reakce pro malé úkoly a zároveň udržuje prodloužené vícehodinové běhy pro velké projekty. Model je trénován k provádění strukturovaných revizí kódu, zachycování kritických chyb usuzováním nad závislostmi a validací chování proti testům. Podporuje také multimodální vstupy, jako jsou obrázky nebo snímky obrazovky pro vývoj uživatelského rozhraní, a integruje používání nástrojů pro vyhledávání, instalaci závislostí a nastavení prostředí. Codex je určen speciálně pro agentní kódovací aplikace.

Unikátní charakteristiky

GPT-5 Codex je specializovaná verze GPT-5 optimalizovaná pro softwarové inženýrství a kódovací workflow. Vyniká v matematických úlohách (aime_25: 98.7%) a programování (LiveCodeBench: 84.0%).

Silné stránky

Programování

Vysoké skóre v LiveCodeBench (84.0) naznačuje silné schopnosti v generování a porozumění kódu.

Matematika

Výborné výsledky v aime_25 (98.7) a artificial_analysis_math_index (98.7) ukazují na silné matematické dovednosti.

Slabé stránky

Rychlost

Relativně nízké TPS (210.8) a vysoká latence (21.908s) znamenají pomalejší odezvu v porovnání s konkurencí.

Čeština

Nedostupnost dat pro MMMLU v češtině znemožňuje posoudit kvalitu modelu v českém jazyce.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5

4x dražší vstup, 2.5x dražší výstup

Claude Opus je silný konkurent v obecné inteligenci, ale dražší.

GOOGLE google/gemini-3-pro-preview

1.6x dražší vstup, 1.2x dražší výstup

Gemini Pro nabízí velký kontext, ale je dražší.

X-AI x-ai/grok-code-fast-1

6.25x levnější vstup, 1.5x levnější výstup

Grok-code-fast-1 je levnější alternativa pro kódování, ale může mít nižší kvalitu výstupu.

MISTRALAI mistralai/ministral-14b-2512

6.25x levnější vstup, 50x levnější výstup

Mistral 14B je výrazně levnější, ale nemusí dosahovat stejné úrovně inteligence.

Doporučení

Cílová skupina

Softwaroví inženýři
Výzkumníci v oblasti AI

Vhodné pro

Generování kódu
Automatické opravy chyb
Řešení matematických problémů

Nevhodné pro

Aplikace vyžadující nízkou latenci
Úlohy v českém jazyce (bez testování)

Verdikt

GPT-5 Codex je vhodný pro softwarové inženýry a výzkumníky, kteří potřebují výkonný model pro generování kódu a řešení matematických problémů, ale měli by zvážit jeho latenci a neznámou kvalitu v češtině.