Mistral 10. 07. 2025

Mistral: Devstral Medium

mistralai/devstral-medium

Generování kódu Agentní uvažování

35 /100

Slabý

💰

Vstup

$0.4/1M

📤

Výstup

$2.0/1M

📏

Kontext

131072

📝

Max výstup

N/A

Vstup: text → Výstup: text

💪 Silné stránky

Generování kódu Dosahuje 61.6% na SWE-Bench Verified, což je lepší než Gemini 2.5 Pro a GPT-4.1.

Cena Nabízí srovnatelný výkon jako dražší modely (Gemini, GPT-4) za výrazně nižší cenu.

⚠️ Slabé stránky

Obecná inteligence Celkové skóre 36.4/100 naznačuje slabší výkon v oblastech mimo kódování a agentní uvažování.

Čeština MMMLU skóre pro češtinu není k dispozici, což ztěžuje posouzení použitelnosti v českém jazyce.

Hodnocení podle kategorií

🧮

Věda & Matematika

36.5

Slabý

💻

Programování

33.7

Slabý

🤖

Agenti & Nástroje

19.9

Slabý

🧠

Obecná inteligence

45.7

Průměrný

⚡

Rychlost

55.8

Průměrný

Expertní hodnocení

🎯

Killer Feature

Vynikající poměr cena/výkon v generování kódu.

⚡

Skryté riziko

Slabší výkon v oblastech mimo kódování a agentní uvažování, neznámá kvalita češtiny.

✅

Doporučený scénář

Automatizace generování kódu a vývoj agentů pro specifické úlohy.

Devstral Medium je vysoce výkonný model pro generování kódu a agentní usuzování, vyvinutý společně společnostmi Mistral AI a All Hands AI. Je koncipován jako vylepšení oproti Devstral Small a dosahuje 61,6 % na SWE-Bench Verified, čímž v úlohách souvisejících s kódem předčí Gemini 2.5 Pro a GPT-4.1, a to za zlomek nákladů. Je navržen pro generalizaci napříč styly promptů a používání nástrojů v kódových agentech a frameworkách.

Devstral Medium je dostupný pouze přes API (není open-weight) a podporuje nasazení v podnikovém prostředí na soukromé infrastruktuře, s volitelnými možnostmi fine-tuningu.

Unikátní charakteristiky

Devstral Medium vyniká v generování kódu a agentním uvažování, s výkonem srovnatelným s Gemini 2.5 Pro a GPT-4.1 v kódovacích úlohách, ale za zlomek ceny. Je navržen pro generalizaci napříč různými styly promptů a pro použití nástrojů v kódovacích agentech a frameworkách.

Silné stránky

Generování kódu

Dosahuje 61.6% na SWE-Bench Verified, což je lepší než Gemini 2.5 Pro a GPT-4.1.

Cena

Nabízí srovnatelný výkon jako dražší modely (Gemini, GPT-4) za výrazně nižší cenu.

Slabé stránky

Obecná inteligence

Celkové skóre 36.4/100 naznačuje slabší výkon v oblastech mimo kódování a agentní uvažování.

Čeština

MMMLU skóre pro češtinu není k dispozici, což ztěžuje posouzení použitelnosti v českém jazyce.

Srovnání s konkurencí

GOOGLE google/gemini-2.5-flash-image

Levnější vstup, dražší výstup

Gemini 2.5 Flash Image je levnější na vstupu, ale Devstral Medium má lepší kontext a pravděpodobně lepší výkon v kódování.

OPENAI openai/gpt-5.1-codex-max

Dražší vstup i výstup

GPT-5.1 Codex Max je dražší, ale může nabízet lepší obecnou inteligenci a širší škálu schopností (data nejsou k dispozici).

X-AI x-ai/grok-code-fast-1

Levnější vstup, levnější výstup

Grok-code-fast-1 je výrazně levnější, ale může mít horší výkon v náročnějších kódovacích úlohách (data nejsou k dispozici).

DEEPSEEK deepseek/deepseek-v3.2

Levnější vstup, levnější výstup

Deepseek v3.2 je levnější, ale Devstral Medium má větší kontext a pravděpodobně lepší výkon v agentním uvažování.

Doporučení

Cílová skupina

Vývojáři softwaru
AI inženýři

Vhodné pro

Generování kódu
Automatizace úloh pomocí agentů

Nevhodné pro

Úlohy vyžadující vysokou úroveň matematických schopností
Aplikace vyžadující silnou podporu češtiny

Verdikt

Devstral Medium je vhodný pro vývojáře, kteří hledají cenově efektivní řešení pro generování kódu a automatizaci úloh pomocí agentů, ale měli by zvážit jeho omezení v obecné inteligenci a jazykové podpoře.