Společnost OpenAI zpřístupnila novou rodinu jazykových modelů GPT-5, která nahrazuje většinu stávající nabídky. Modely jsou dostupné ve třech velikostech s konfigurovatelnou úrovní uvažování a přinášejí výrazné snížení cen při zachování nebo zlepšení výkonu.
Architektura a varianty modelů
GPT-5 v prostředí ChatGPT funguje jako hybridní systém, který automaticky přepíná mezi různými modely podle složitosti úlohy. Systém obsahuje rychlý model pro běžné dotazy, hlubší model pro uvažování u složitějších problémů a směrovač v reálném čase, který rozhoduje o výběru modelu na základě typu konverzace, složitosti a explicitních pokynů uživatele.
V rozhraní API je situace přímočařejší. OpenAI nabízí tři modely:
GPT-5 - plná verze modelu s nejvyšším výkonem
GPT-5 Mini - střední varianta s vyváženým poměrem cena/výkon
GPT-5 Nano - nejmenší a nejlevnější varianta
Každý z těchto modelů lze provozovat na jedné ze čtyř úrovní uvažování:
- Minimální - nová úroveň, která nebyla dostupná u předchozích modelů OpenAI, určená pro rychlé odpovědi
- Nízká - základní uvažování
- Střední - výchozí nastavení s vyváženým výkonem
- Vysoká - maximální úroveň uvažování pro složité úlohy
Modely podporují vstup až 272 000 tokenů a výstup do 128 000 tokenů (včetně neviditelných tokenů uvažování). Na vstupu přijímají text a obrázky, výstup je pouze textový.
Cenová politika
OpenAI nastavilo ceny agresivně vůči konkurenci:
Model | Vstup ($/milion tokenů) | Výstup ($/milion tokenů) |
---|---|---|
GPT-5 | 1,25 | 10,00 |
GPT-5 Mini | 0,25 | 2,00 |
GPT-5 Nano | 0,05 | 0,40 |
Plná verze GPT-5 je oceněna na polovinu vstupních nákladů oproti GPT-4o při zachování stejné ceny výstupu. Neviditelné tokeny uvažování se počítají jako výstupní tokeny, takže při vyšších úrovních uvažování lze očekávat vyšší spotřebu než u ekvivalentních dotazů na GPT-4o.
Významná je sleva 90 % na vstupní tokeny, které byly použity v předchozích několika minutách díky mechanismu mezipaměti tokenů. To je podstatné zejména při implementaci konverzačních rozhraní, kde se stejná konverzace přehrává při každém dalším vstupu uživatele.
Pozice v portfoliu OpenAI
Nové modely GPT-5 jsou navrženy jako náhrada většiny stávající nabídky OpenAI:
Předchozí model | Náhrada v GPT-5 |
---|---|
GPT-4o | gpt-5-main |
GPT-4o-mini | gpt-5-main-mini |
OpenAI o3 | gpt-5-thinking |
OpenAI o4-mini | gpt-5-thinking-mini |
GPT-4.1-nano | gpt-5-thinking-nano |
OpenAI o3 Pro | gpt-5-thinking-pro |
Model “thinking-pro” je zatím dostupný pouze přes ChatGPT jako “GPT-5 Pro” v rámci předplatného za 200 dolarů měsíčně. Využívá paralelní výpočty v čase inference.
Jediné schopnosti, které GPT-5 nepokrývá, jsou zvukový vstup/výstup a generování obrázků. Ty zůstávají pokryty modely jako GPT-4o Audio, GPT-4o Realtime a generátory obrázků DALL-E.
Vylepšení v oblasti bezpečnosti a spolehlivosti
Redukce halucinací
OpenAI uvádí výrazné snížení výskytu faktických halucinací. Trénink se zaměřil jak na efektivní používání vyhledávacích nástrojů pro aktuální informace, tak na snížení halucinací při spoléhání na interní znalosti modelu.
Společnost také pracovala na problému, kdy modely předstírají dokončení úlohy, která je pro ně příliš složitá. GPT-5 byl trénován na scénářích s částečně nebo zcela neproveditelných úlohách a odměňován za upřímné přiznání, že úlohu nemůže dokončit.
Bezpečnostní dokončování
Místo binárního přístupu (buď pomoci, nebo odmítnout) zavádí OpenAI koncept “bezpečných dokončení” (safe-completions). Tento přístup se zaměřuje na bezpečnost výstupu asistenta spíše než na binární klasifikaci záměru uživatele. Bezpečná dokončení maximalizují užitečnost v rámci omezení bezpečnostní politiky.
To je užitečné zejména u oblastí dvojího použití jako biologie nebo kyberbezpečnost, kde může být požadavek uživatele bezpečně splněn na vysoké úrovni, ale mohl by vést ke škodlivému využití, pokud by byl příliš detailní.
Odolnost proti promptové injekci
Externí týmy provedly dvoutýdenní hodnocení odolnosti proti promptové injekci. Výsledky ukazují výrazné zlepšení - GPT-5 dosáhl úspěšnosti útoků 56,8 %, což je výrazně lepší než Claude 3.7 (okolo 60 %) a ostatní modely (přes 70 %).
Přesto zůstává promptová injekce nevyřešeným problémem - více než polovina útoků s možností deseti pokusů byla úspěšná. To signalizuje, že aplikace nemohou spoléhat pouze na zlepšení modelů pro ochranu proti těmto útokům.
Přístup k trasám uvažování
Zajímavostí je, že trasy uvažování jsou dostupné přes API pomocí parametru "reasoning": {"summary": "auto"}
. Bez této volby může API poskytnout výrazné zpoždění, zatímco model zpracovává tokeny uvažování, než začne vracet viditelné tokeny finální odpovědi.
OpenAI nabízí možnost reasoning_effort=minimal
, která vypíná většinu uvažování, aby tokeny začaly proudit zpět co nejrychleji.
Znalostní hranice a dostupnost
GPT-5 má znalostní hranici 30. září 2024, zatímco varianty Mini a Nano mají hranici 30. května 2024. Modely jsou dostupné přes API OpenAI s identifikátory:
gpt-5
pro plnou verzigpt-5-mini
pro střední variantugpt-5-nano
pro nejmenší model
Praktické zkušenosti
Podle prvních uživatelů, kteří měli přístup k preview verzi, GPT-5 nepředstavuje dramatický skok oproti ostatním velkým jazykovým modelům, ale vyniká konzistencí a spolehlivostí. Model zřídka selhává a často překvapí kvalitou odpovědí. Uživatelé uvádějí, že se stal jejich výchozím modelem pro většinu úloh bez potřeby přepínat mezi různými modely podle typu úlohy.
Model si dobře poradil i s generováním SVG grafiky, což je tradičně náročná úloha pro jazykové modely. Při testu generování SVG pelikána jedoucího na kole vytvořily všechny tři varianty rozpoznatelné výsledky, přičemž plná verze GPT-5 vytvořila jeden z nejlepších výsledků v této kategorii.
Na větší vyhodnocení si ale budeme muset počkat. Sam jsem se k modelu dostal na poslední chvíli a na praktické zkušenosti nebyl moc čas.