DeepSeek

DeepSeek: R1 0528

deepseek/deepseek-r1-0528
Matematika Programování
58 /100
Průměrný
💰
Vstup
$0.4/1M
📤
Výstup
$1.75/1M
📏
Kontext
163840
📝
Max výstup
163840
Vstup: text Výstup: text

💪 Silné stránky

Matematika Vynikající výkon v matematických úlohách, s vysokým skóre v MATH-500 (98.3%) a AIME 2025 (89.3%).
Programování Silný v kódování, dosahuje 77.0% na LiveCodeBench.

⚠️ Slabé stránky

Agenti a nástroje Slabý výkon v úlohách zaměřených na agenty, s nízkým skóre 36.5% na τ2-Bench.
Rychlost Nízká rychlost inference, což omezuje jeho použitelnost v aplikacích vyžadujících rychlou odezvu.

Hodnocení podle kategorií

🧮
Věda & Matematika
87.9
Výborný
💻
Programování
77.0
Výborný
🤖
Agenti & Nástroje
36.5
Slabý
🧠
Obecná inteligence
58.6
Průměrný
Rychlost
0.0
Slabý

Expertní hodnocení

🎯
Killer Feature
Vynikající výkon v matematice a programování s otevřeným přístupem.
Skryté riziko
Slabší výkon v úlohách zaměřených na agenty a nástroje, pomalá inference.
Doporučený scénář
Výzkum v oblasti matematiky a vývoj vědeckých aplikací.

Aktualizace z 28. května k původnímu DeepSeek R1 s výkonem srovnatelným s OpenAI o1, ale s otevřeným zdrojovým kódem a plně otevřenými reasoning tokeny. Má velikost 671B parametrů, přičemž 37B je aktivních v jednom průchodu inferencí.

Plně open-source model.

Unikátní charakteristiky

DeepSeek R1 0528 je open-source model s vysokým kontextem a silným výkonem v matematice a programování. Jeho otevřenost a plně otevřené reasoning tokeny ho odlišují od uzavřených modelů.

Silné stránky

Matematika

Vynikající výkon v matematických úlohách, s vysokým skóre v MATH-500 (98.3%) a AIME 2025 (89.3%).

Programování

Silný v kódování, dosahuje 77.0% na LiveCodeBench.

Slabé stránky

Agenti a nástroje

Slabý výkon v úlohách zaměřených na agenty, s nízkým skóre 36.5% na τ2-Bench.

Rychlost

Nízká rychlost inference, což omezuje jeho použitelnost v aplikacích vyžadujících rychlou odezvu.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5
Výrazně dražší (7x vstup, 14x výstup)

Claude Opus je pravděpodobně silnější v obecné inteligenci, ale dražší.

GOOGLE google/gemini-3-pro-preview
Dražší (5x vstup, 7x výstup)

Gemini Pro má větší kontext, ale je dražší.

MISTRALAI mistralai/ministral-14b-2512
Levnější (poloviční cena)

Ministral 14B je levnější, ale pravděpodobně méně výkonný v matematice.

DEEPSEEK deepseek/deepseek-v3.2-speciale
Levnější (poloviční cena)

Deepseek v3.2 Speciale je levnější alternativou od stejného poskytovatele.

Doporučení

Cílová skupina

  • Výzkumníci v oblasti AI
  • Vývojáři matematických aplikací

Vhodné pro

  • Řešení komplexních matematických problémů
  • Generování kódu pro vědecké výpočty

Nevhodné pro

  • Aplikace vyžadující rychlou odezvu
  • Úlohy zaměřené na agenty a nástroje

Verdikt

DeepSeek R1 0528 je vhodný pro výzkumníky a vývojáře, kteří potřebují silný model pro matematické a programovací úlohy a oceňují otevřený přístup.