DeepSeek

DeepSeek: R1 Distill Qwen 14B

deepseek/deepseek-r1-distill-qwen-14b
48 /100
Průměrný
💰
Vstup
$0.12/1M
📤
Výstup
$0.12/1M
📏
Kontext
32768
📝
Max výstup
16384
Vstup: text Výstup: text

💪 Silné stránky

⚠️ Slabé stránky

Hodnocení podle kategorií

🧮
Věda & Matematika
65.0
Dobrý
💻
Programování
37.6
Slabý
🧠
Obecná inteligence
47.9
Průměrný
Rychlost
16.4
Slabý

DeepSeek R1 Distill Qwen 14B je destilovaný velký jazykový model založený na Qwen 2.5 14B, využívající výstupy z DeepSeek R1. Překonává o1-mini od OpenAI v různých benchmarkách a dosahuje nových nejlepších výsledků (state-of-the-art) pro husté modely.

Další výsledky benchmarků zahrnují:

  • AIME 2024 pass@1: 69.7
  • MATH-500 pass@1: 93.9
  • CodeForces Rating: 1481

Model využívá jemné doladění (fine-tuning) z výstupů DeepSeek R1, což umožňuje konkurenceschopný výkon srovnatelný s většími špičkovými modely (frontier models).

Srovnání s konkurencí