DeepSeek: R1 Distill Qwen 32B
deepseek/deepseek-r1-distill-qwen-32b
48
/100
Průměrný
Vstup
$0.24/1M
Výstup
$0.24/1M
Kontext
64000
Max výstup
32000
Vstup:
text
→
Výstup:
text
💪 Silné stránky
⚠️ Slabé stránky
Hodnocení podle kategorií
Věda & Matematika
70.9
Dobrý
Programování
27.0
Slabý
Obecná inteligence
48.2
Průměrný
Rychlost
34.2
Slabý
DeepSeek R1 Distill Qwen 32B je destilovaný velký jazykový model založený na Qwen 2.5 32B, využívající výstupy z DeepSeek R1. Překonává o1-mini od OpenAI v různých benchmarkách a dosahuje nových nejlepších výsledků pro husté modely.
Další výsledky benchmarků zahrnují:
- AIME 2024 pass@1: 72.6
- MATH-500 pass@1: 94.3
- CodeForces Rating: 1691
Model využívá jemné doladění z výstupů DeepSeek R1, což umožňuje konkurenceschopný výkon srovnatelný s většími špičkovými modely.