OpenAI: gpt-oss-20b
openai/gpt-oss-20b
💪 Silné stránky
⚠️ Slabé stránky
Hodnocení podle kategorií
Expertní hodnocení
gpt-oss-20b je model s otevřenými váhami a 21 miliardami parametrů, vydaný společností OpenAI pod licencí Apache 2.0. Používá architekturu Mixture-of-Experts (MoE) s 3,6 miliardami aktivních parametrů na jeden průchod dopřednou sítí, optimalizovanou pro inferenci s nižší latencí a nasazení na spotřebitelském hardwaru nebo hardwaru s jednou GPU. Model je trénován ve formátu odezvy Harmony společnosti OpenAI a podporuje konfiguraci úrovně usuzování, dolaďování a agentní schopnosti včetně volání funkcí, používání nástrojů a strukturovaných výstupů.
Unikátní charakteristiky
gpt-oss-20b je open-source model s architekturou Mixture-of-Experts, optimalizovaný pro nízkou latenci a nasazení na spotřebitelském hardwaru. Vyniká v matematických úlohách a programování, což dokazují vysoké skóre v aime_25 a LiveCodeBench.
Silné stránky
Programování
Vysoké skóre v LiveCodeBench (77.7%) naznačuje silné schopnosti v oblasti kódování.
Matematika
Vynikající výkon v aime_25 (89.3%) a artificial_analysis_math_index (89.3%) ukazuje na silné matematické dovednosti.
Slabé stránky
Logické uvažování
Nízké skóre v HLE (9.8%) a terminalbench_hard (9.9%) naznačuje slabiny v hard logickém uvažování.
Obecná inteligence
Průměrné skóre v AI Intelligence Index (52.1%) a MMLU Pro (74.8%) naznačuje, že model není špičkový v obecných znalostech.
Srovnání s konkurencí
Levnější alternativa s velkým kontextem, ale pravděpodobně nižší inteligencí.
Ještě levnější, ale s menšími parametry a potenciálně nižší kvalitou.
Konkurenční model s podobnými parametry, ale menším kontextem.
Velmi levný model, zaměřený na kódování, ale s menším kontextem.
Doporučení
Cílová skupina
- Vývojáři
- Vědci
- Studenti
Vhodné pro
- Generování kódu
- Matematické výpočty
- Prototypování agentů
Nevhodné pro
- Složité logické úlohy
- Aplikace vyžadující hluboké znalosti v češtině
Verdikt
gpt-oss-20b je dobrá volba pro vývojáře a vědce, kteří potřebují model s dobrými matematickými a programovacími schopnostmi, ale měli by se vyhnout úlohám vyžadujícím složité logické uvažování.