DeepSeek

DeepSeek: R1 Distill Llama 70B

deepseek/deepseek-r1-distill-llama-70b
40 /100
Slabý
💰
Vstup
$0.03/1M
📤
Výstup
$0.13/1M
📏
Kontext
131072
📝
Max výstup
131072
Vstup: text Výstup: text

💪 Silné stránky

⚠️ Slabé stránky

Hodnocení podle kategorií

🧮
Věda & Matematika
61.6
Dobrý
💻
Programování
26.6
Slabý
🤖
Agenti & Nástroje
21.9
Slabý
🧠
Obecná inteligence
52.0
Průměrný
Rychlost
26.7
Slabý

DeepSeek R1 Distill Llama 70B je destilovaný velký jazykový model založený na Llama-3.3-70B-Instruct, využívající výstupy z DeepSeek R1. Model kombinuje pokročilé techniky destilace k dosažení vysokého výkonu v několika benchmarkách, včetně:

  • AIME 2024 pass@1: 70.0
  • MATH-500 pass@1: 94.5
  • CodeForces Rating: 1633

Model využívá doladění z výstupů DeepSeek R1, což umožňuje konkurenceschopný výkon srovnatelný s většími špičkovými modely.

Srovnání s konkurencí