GPT-5.2-Codex od OpenAI posouvá inženýrství softwaru lepším uvažováním a porozuměním kontextu

Souhrn

OpenAI Group PBC, společnost zaměřená na vývoj pokročilých modelů umělé inteligence, vydalo GPT-5.2-Codex, aktualizovanou verzi svého agentického modelu pro automatizaci úkolů v inženýrství softwaru. Tento model vychází z GPT-5.2 a zlepšuje schopnosti v oblasti porozumění dlouhým kontextům, refaktoringu kódu a interakce s operačními systémy. Na benchmarku SWE-Bench Pro dosáhl přesnosti 56,4 procenta a na Terminal-Bench 2.0 skóre 64 procent.

Klíčové body

Nejvyšší dosavadní skóre na SWE-Bench Pro: 56,4 % přesnost při řešení reálných úkolů z GitHubu.
64 % na Terminal-Bench 2.0, což testuje práci v terminálu a systémové operace.
Zlepšené vizuální schopnosti pro analýzu screenshotů, technických diagramů a uživatelských rozhraní, umožňující převod návrhů na funkční prototypy.
Vylepšení v kompresi kontextu, refaktoringu velkých kódových základů, výkonu ve Windows a kyberbezpečnostních opatřeních.
Navazuje na předchozí iterace jako GPT-5-Codex a GPT-5.1-Codex-Max s postupným zlepšením vícekrokového uvažování.

Podrobnosti

GPT-5.2-Codex je navržen pro inženýrství softwaru, což zahrnuje návrh, vývoj, testování a údržbu aplikací kombinací inženýrských principů a programování. Cílem je vytvářet kvalitní, spolehlivý a udržitelný software, který se přizpůsobuje potřebám uživatelů. Klíčovou funkcí je refaktoring, tedy přepracování existujícího kódu bez změny jeho funkcí, ale s cílem zlepšit kvalitu – například snížit spotřebu paměti nebo zrychlit odezvu aplikace. Model zvládá časově náročné úkoly, jako je analýza a optimalizace velkých kódových repozitářů.

Novinka přináší pokročilejší vizuální zpracování, díky čemuž interpretuje screenshoty, diagramy a uživatelská rozhraní. To umožňuje převést designové mockupy – statické návrhy aplikací – přímo na funkční prototypy v kódu. Na benchmarku SWE-Bench Pro, který simuluje reálné problémy z GitHubu, překonal všechny předchozí modely. Terminal-Bench 2.0 testuje schopnosti v terminálovém prostředí, jako jsou systémové příkazy a skriptování, kde GPT-5.2-Codex exceluje oproti starším verzím Codexu.

Zlepšení v kompresi kontextu znamená efektivnější zpracování dlouhých sekvenc kódu bez ztráty informací, což je klíčové pro velké projekty. Výkon ve Windows zahrnuje lepší kompatibilitu s tímto operačním systémem, včetně ladění a nasazení. Kyberbezpečnostní aspekty zahrnují detekci zranitelností v kódu během refaktoringu. Model je součástí řady iterací OpenAI v generativní AI pro kódování, kde předchozí verze jako GPT-5-Codex zlepšovaly multistep reasoning – vícekrokové uvažování – a dlouhé kontexty. OpenAI Group PBC, které funguje jako public benefit corporation, tak pokračuje v komercializaci těchto technologií.

Proč je to důležité

GPT-5.2-Codex urychluje vývoj softwaru tím, že automatizuje rutinní i složité úkoly, což umožní vývojářům soustředit se na inovace. Pro průmysl znamená snížení nákladů na údržbu kódu a rychlejší iterace projektů, zejména v oblastech jako webový vývoj nebo enterprise aplikace. V širším kontextu posiluje trend agentických AI systémů, které autonomně plní cíle, ale vyžaduje opatrnost kvůli rizikům – například generování chybně zabezpečeného kódu nebo závislosti na proprietárních modelech. Dosavadní benchmarky ukazují reálný pokrok, avšak dlouhodobá spolehlivost v produkčním prostředí zůstává k ověření. Tento vývoj ovlivní konkurenci jako Anthropic s Claude nebo Google s Gemini, kde se soutěží o převahu v kódovacích asistentech.

Číst původní článek

Zdroj: 📰 SiliconANGLE News