Mistral

Mistral: Devstral Medium

mistralai/devstral-medium
Generování kódu Agentní uvažování
35 /100
Slabý
💰
Vstup
$0.4/1M
📤
Výstup
$2.0/1M
📏
Kontext
131072
📝
Max výstup
N/A
Vstup: text Výstup: text

💪 Silné stránky

Generování kódu Dosahuje 61.6% na SWE-Bench Verified, což je lepší než Gemini 2.5 Pro a GPT-4.1.
Cena Nabízí srovnatelný výkon jako dražší modely (Gemini, GPT-4) za výrazně nižší cenu.

⚠️ Slabé stránky

Obecná inteligence Celkové skóre 36.4/100 naznačuje slabší výkon v oblastech mimo kódování a agentní uvažování.
Čeština MMMLU skóre pro češtinu není k dispozici, což ztěžuje posouzení použitelnosti v českém jazyce.

Hodnocení podle kategorií

🧮
Věda & Matematika
36.5
Slabý
💻
Programování
33.7
Slabý
🤖
Agenti & Nástroje
19.9
Slabý
🧠
Obecná inteligence
45.7
Průměrný
Rychlost
55.8
Průměrný

Expertní hodnocení

🎯
Killer Feature
Vynikající poměr cena/výkon v generování kódu.
Skryté riziko
Slabší výkon v oblastech mimo kódování a agentní uvažování, neznámá kvalita češtiny.
Doporučený scénář
Automatizace generování kódu a vývoj agentů pro specifické úlohy.

Devstral Medium je vysoce výkonný model pro generování kódu a agentní usuzování, vyvinutý společně společnostmi Mistral AI a All Hands AI. Je koncipován jako vylepšení oproti Devstral Small a dosahuje 61,6 % na SWE-Bench Verified, čímž v úlohách souvisejících s kódem předčí Gemini 2.5 Pro a GPT-4.1, a to za zlomek nákladů. Je navržen pro generalizaci napříč styly promptů a používání nástrojů v kódových agentech a frameworkách.

Devstral Medium je dostupný pouze přes API (není open-weight) a podporuje nasazení v podnikovém prostředí na soukromé infrastruktuře, s volitelnými možnostmi fine-tuningu.

Unikátní charakteristiky

Devstral Medium vyniká v generování kódu a agentním uvažování, s výkonem srovnatelným s Gemini 2.5 Pro a GPT-4.1 v kódovacích úlohách, ale za zlomek ceny. Je navržen pro generalizaci napříč různými styly promptů a pro použití nástrojů v kódovacích agentech a frameworkách.

Silné stránky

Generování kódu

Dosahuje 61.6% na SWE-Bench Verified, což je lepší než Gemini 2.5 Pro a GPT-4.1.

Cena

Nabízí srovnatelný výkon jako dražší modely (Gemini, GPT-4) za výrazně nižší cenu.

Slabé stránky

Obecná inteligence

Celkové skóre 36.4/100 naznačuje slabší výkon v oblastech mimo kódování a agentní uvažování.

Čeština

MMMLU skóre pro češtinu není k dispozici, což ztěžuje posouzení použitelnosti v českém jazyce.

Srovnání s konkurencí

GOOGLE google/gemini-2.5-flash-image
Levnější vstup, dražší výstup

Gemini 2.5 Flash Image je levnější na vstupu, ale Devstral Medium má lepší kontext a pravděpodobně lepší výkon v kódování.

OPENAI openai/gpt-5.1-codex-max
Dražší vstup i výstup

GPT-5.1 Codex Max je dražší, ale může nabízet lepší obecnou inteligenci a širší škálu schopností (data nejsou k dispozici).

X-AI x-ai/grok-code-fast-1
Levnější vstup, levnější výstup

Grok-code-fast-1 je výrazně levnější, ale může mít horší výkon v náročnějších kódovacích úlohách (data nejsou k dispozici).

DEEPSEEK deepseek/deepseek-v3.2
Levnější vstup, levnější výstup

Deepseek v3.2 je levnější, ale Devstral Medium má větší kontext a pravděpodobně lepší výkon v agentním uvažování.

Doporučení

Cílová skupina

  • Vývojáři softwaru
  • AI inženýři

Vhodné pro

  • Generování kódu
  • Automatizace úloh pomocí agentů

Nevhodné pro

  • Úlohy vyžadující vysokou úroveň matematických schopností
  • Aplikace vyžadující silnou podporu češtiny

Verdikt

Devstral Medium je vhodný pro vývojáře, kteří hledají cenově efektivní řešení pro generování kódu a automatizaci úloh pomocí agentů, ale měli by zvážit jeho omezení v obecné inteligenci a jazykové podpoře.