Openai 05. 08. 2025

OpenAI: gpt-oss-20b

openai/gpt-oss-20b

Programování Věda a matematika

67 /100

Dobrý

💰

Vstup

$0.03/1M

📤

Výstup

$0.14/1M

📏

Kontext

131072

📝

Max výstup

N/A

Vstup: text → Výstup: text

💪 Silné stránky

Programování Vysoké skóre v LiveCodeBench (77.7%) naznačuje silné schopnosti v oblasti kódování.

Matematika Vynikající výkon v aime_25 (89.3%) a artificial_analysis_math_index (89.3%) ukazuje na silné matematické dovednosti.

⚠️ Slabé stránky

Logické uvažování Nízké skóre v HLE (9.8%) a terminalbench_hard (9.9%) naznačuje slabiny v hard logickém uvažování.

Obecná inteligence Průměrné skóre v AI Intelligence Index (52.1%) a MMLU Pro (74.8%) naznačuje, že model není špičkový v obecných znalostech.

Hodnocení podle kategorií

🧮

Věda & Matematika

68.8

Dobrý

💻

Programování

77.7

Výborný

🤖

Agenti & Nástroje

60.2

Dobrý

🧠

Obecná inteligence

50.4

Průměrný

⚡

Rychlost

74.3

Dobrý

Expertní hodnocení

🎯

Killer Feature

Vynikající matematické schopnosti

⚡

Skryté riziko

Slabé logické uvažování a potenciální problémy s češtinou (data nejsou k dispozici)

✅

Doporučený scénář

Vývoj aplikací vyžadujících matematické výpočty a generování kódu.

gpt-oss-20b je model s otevřenými váhami a 21 miliardami parametrů, vydaný společností OpenAI pod licencí Apache 2.0. Používá architekturu Mixture-of-Experts (MoE) s 3,6 miliardami aktivních parametrů na jeden průchod dopřednou sítí, optimalizovanou pro inferenci s nižší latencí a nasazení na spotřebitelském hardwaru nebo hardwaru s jednou GPU. Model je trénován ve formátu odezvy Harmony společnosti OpenAI a podporuje konfiguraci úrovně usuzování, dolaďování a agentní schopnosti včetně volání funkcí, používání nástrojů a strukturovaných výstupů.

Unikátní charakteristiky

gpt-oss-20b je open-source model s architekturou Mixture-of-Experts, optimalizovaný pro nízkou latenci a nasazení na spotřebitelském hardwaru. Vyniká v matematických úlohách a programování, což dokazují vysoké skóre v aime_25 a LiveCodeBench.

Silné stránky

Programování

Vysoké skóre v LiveCodeBench (77.7%) naznačuje silné schopnosti v oblasti kódování.

Matematika

Vynikající výkon v aime_25 (89.3%) a artificial_analysis_math_index (89.3%) ukazuje na silné matematické dovednosti.

Slabé stránky

Logické uvažování

Nízké skóre v HLE (9.8%) a terminalbench_hard (9.9%) naznačuje slabiny v hard logickém uvažování.

Obecná inteligence

Průměrné skóre v AI Intelligence Index (52.1%) a MMLU Pro (74.8%) naznačuje, že model není špičkový v obecných znalostech.

Srovnání s konkurencí

MISTRALAI mistralai/ministral-14b-2512

3x levnější vstup i výstup

Levnější alternativa s velkým kontextem, ale pravděpodobně nižší inteligencí.

MISTRALAI mistralai/ministral-8b-2512

4x levnější vstup i výstup

Ještě levnější, ale s menšími parametry a potenciálně nižší kvalitou.

DEEPSEEK deepseek/deepseek-v3.2

Mírně levnější vstup i výstup

Konkurenční model s podobnými parametry, ale menším kontextem.

X-AI x-ai/grok-code-fast-1

3x levnější vstup, 7x levnější výstup

Velmi levný model, zaměřený na kódování, ale s menším kontextem.

Doporučení

Cílová skupina

Vývojáři
Vědci
Studenti

Vhodné pro

Generování kódu
Matematické výpočty
Prototypování agentů

Nevhodné pro

Složité logické úlohy
Aplikace vyžadující hluboké znalosti v češtině

Verdikt

gpt-oss-20b je dobrá volba pro vývojáře a vědce, kteří potřebují model s dobrými matematickými a programovacími schopnostmi, ale měli by se vyhnout úlohám vyžadujícím složité logické uvažování.