DeepSeek: R1 Distill Llama 70B
deepseek/deepseek-r1-distill-llama-70b
40
/100
Slabý
Vstup
$0.03/1M
Výstup
$0.13/1M
Kontext
131072
Max výstup
131072
Vstup:
text
→
Výstup:
text
💪 Silné stránky
⚠️ Slabé stránky
Hodnocení podle kategorií
Věda & Matematika
61.6
Dobrý
Programování
26.6
Slabý
Agenti & Nástroje
21.9
Slabý
Obecná inteligence
52.0
Průměrný
Rychlost
26.7
Slabý
DeepSeek R1 Distill Llama 70B je destilovaný velký jazykový model založený na Llama-3.3-70B-Instruct, využívající výstupy z DeepSeek R1. Model kombinuje pokročilé techniky destilace k dosažení vysokého výkonu v několika benchmarkách, včetně:
- AIME 2024 pass@1: 70.0
- MATH-500 pass@1: 94.5
- CodeForces Rating: 1633
Model využívá doladění z výstupů DeepSeek R1, což umožňuje konkurenceschopný výkon srovnatelný s většími špičkovými modely.