DeepSeek 28. 05. 2025

DeepSeek: R1 0528

deepseek/deepseek-r1-0528

Matematika Programování

58 /100

Průměrný

💰

Vstup

$0.4/1M

📤

Výstup

$1.75/1M

📏

Kontext

163840

📝

Max výstup

163840

Vstup: text → Výstup: text

💪 Silné stránky

Matematika Vynikající výkon v matematických úlohách, s vysokým skóre v MATH-500 (98.3%) a AIME 2025 (89.3%).

Programování Silný v kódování, dosahuje 77.0% na LiveCodeBench.

⚠️ Slabé stránky

Agenti a nástroje Slabý výkon v úlohách zaměřených na agenty, s nízkým skóre 36.5% na τ2-Bench.

Rychlost Nízká rychlost inference, což omezuje jeho použitelnost v aplikacích vyžadujících rychlou odezvu.

Hodnocení podle kategorií

🧮

Věda & Matematika

87.9

Výborný

💻

Programování

77.0

Výborný

🤖

Agenti & Nástroje

36.5

Slabý

🧠

Obecná inteligence

58.6

Průměrný

⚡

Rychlost

0.0

Slabý

Expertní hodnocení

🎯

Killer Feature

Vynikající výkon v matematice a programování s otevřeným přístupem.

⚡

Skryté riziko

Slabší výkon v úlohách zaměřených na agenty a nástroje, pomalá inference.

✅

Doporučený scénář

Výzkum v oblasti matematiky a vývoj vědeckých aplikací.

Aktualizace z 28. května k původnímu DeepSeek R1 s výkonem srovnatelným s OpenAI o1, ale s otevřeným zdrojovým kódem a plně otevřenými reasoning tokeny. Má velikost 671B parametrů, přičemž 37B je aktivních v jednom průchodu inferencí.

Plně open-source model.

Unikátní charakteristiky

DeepSeek R1 0528 je open-source model s vysokým kontextem a silným výkonem v matematice a programování. Jeho otevřenost a plně otevřené reasoning tokeny ho odlišují od uzavřených modelů.

Silné stránky

Matematika

Vynikající výkon v matematických úlohách, s vysokým skóre v MATH-500 (98.3%) a AIME 2025 (89.3%).

Programování

Silný v kódování, dosahuje 77.0% na LiveCodeBench.

Slabé stránky

Agenti a nástroje

Slabý výkon v úlohách zaměřených na agenty, s nízkým skóre 36.5% na τ2-Bench.

Rychlost

Nízká rychlost inference, což omezuje jeho použitelnost v aplikacích vyžadujících rychlou odezvu.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5

Výrazně dražší (7x vstup, 14x výstup)

Claude Opus je pravděpodobně silnější v obecné inteligenci, ale dražší.

GOOGLE google/gemini-3-pro-preview

Dražší (5x vstup, 7x výstup)

Gemini Pro má větší kontext, ale je dražší.

MISTRALAI mistralai/ministral-14b-2512

Levnější (poloviční cena)

Ministral 14B je levnější, ale pravděpodobně méně výkonný v matematice.

DEEPSEEK deepseek/deepseek-v3.2-speciale

Levnější (poloviční cena)

Deepseek v3.2 Speciale je levnější alternativou od stejného poskytovatele.

Doporučení

Cílová skupina

Výzkumníci v oblasti AI
Vývojáři matematických aplikací

Vhodné pro

Řešení komplexních matematických problémů
Generování kódu pro vědecké výpočty

Nevhodné pro

Aplikace vyžadující rychlou odezvu
Úlohy zaměřené na agenty a nástroje

Verdikt

DeepSeek R1 0528 je vhodný pro výzkumníky a vývojáře, kteří potřebují silný model pro matematické a programovací úlohy a oceňují otevřený přístup.