Openai

OpenAI: gpt-oss-20b

openai/gpt-oss-20b
Programování Věda a matematika
67 /100
Dobrý
💰
Vstup
$0.03/1M
📤
Výstup
$0.14/1M
📏
Kontext
131072
📝
Max výstup
N/A
Vstup: text Výstup: text

💪 Silné stránky

Programování Vysoké skóre v LiveCodeBench (77.7%) naznačuje silné schopnosti v oblasti kódování.
Matematika Vynikající výkon v aime_25 (89.3%) a artificial_analysis_math_index (89.3%) ukazuje na silné matematické dovednosti.

⚠️ Slabé stránky

Logické uvažování Nízké skóre v HLE (9.8%) a terminalbench_hard (9.9%) naznačuje slabiny v hard logickém uvažování.
Obecná inteligence Průměrné skóre v AI Intelligence Index (52.1%) a MMLU Pro (74.8%) naznačuje, že model není špičkový v obecných znalostech.

Hodnocení podle kategorií

🧮
Věda & Matematika
68.8
Dobrý
💻
Programování
77.7
Výborný
🤖
Agenti & Nástroje
60.2
Dobrý
🧠
Obecná inteligence
50.4
Průměrný
Rychlost
74.3
Dobrý

Expertní hodnocení

🎯
Killer Feature
Vynikající matematické schopnosti
Skryté riziko
Slabé logické uvažování a potenciální problémy s češtinou (data nejsou k dispozici)
Doporučený scénář
Vývoj aplikací vyžadujících matematické výpočty a generování kódu.

gpt-oss-20b je model s otevřenými váhami a 21 miliardami parametrů, vydaný společností OpenAI pod licencí Apache 2.0. Používá architekturu Mixture-of-Experts (MoE) s 3,6 miliardami aktivních parametrů na jeden průchod dopřednou sítí, optimalizovanou pro inferenci s nižší latencí a nasazení na spotřebitelském hardwaru nebo hardwaru s jednou GPU. Model je trénován ve formátu odezvy Harmony společnosti OpenAI a podporuje konfiguraci úrovně usuzování, dolaďování a agentní schopnosti včetně volání funkcí, používání nástrojů a strukturovaných výstupů.

Unikátní charakteristiky

gpt-oss-20b je open-source model s architekturou Mixture-of-Experts, optimalizovaný pro nízkou latenci a nasazení na spotřebitelském hardwaru. Vyniká v matematických úlohách a programování, což dokazují vysoké skóre v aime_25 a LiveCodeBench.

Silné stránky

Programování

Vysoké skóre v LiveCodeBench (77.7%) naznačuje silné schopnosti v oblasti kódování.

Matematika

Vynikající výkon v aime_25 (89.3%) a artificial_analysis_math_index (89.3%) ukazuje na silné matematické dovednosti.

Slabé stránky

Logické uvažování

Nízké skóre v HLE (9.8%) a terminalbench_hard (9.9%) naznačuje slabiny v hard logickém uvažování.

Obecná inteligence

Průměrné skóre v AI Intelligence Index (52.1%) a MMLU Pro (74.8%) naznačuje, že model není špičkový v obecných znalostech.

Srovnání s konkurencí

MISTRALAI mistralai/ministral-14b-2512
3x levnější vstup i výstup

Levnější alternativa s velkým kontextem, ale pravděpodobně nižší inteligencí.

MISTRALAI mistralai/ministral-8b-2512
4x levnější vstup i výstup

Ještě levnější, ale s menšími parametry a potenciálně nižší kvalitou.

DEEPSEEK deepseek/deepseek-v3.2
Mírně levnější vstup i výstup

Konkurenční model s podobnými parametry, ale menším kontextem.

X-AI x-ai/grok-code-fast-1
3x levnější vstup, 7x levnější výstup

Velmi levný model, zaměřený na kódování, ale s menším kontextem.

Doporučení

Cílová skupina

  • Vývojáři
  • Vědci
  • Studenti

Vhodné pro

  • Generování kódu
  • Matematické výpočty
  • Prototypování agentů

Nevhodné pro

  • Složité logické úlohy
  • Aplikace vyžadující hluboké znalosti v češtině

Verdikt

gpt-oss-20b je dobrá volba pro vývojáře a vědce, kteří potřebují model s dobrými matematickými a programovacími schopnostmi, ale měli by se vyhnout úlohám vyžadujícím složité logické uvažování.