Mistral: Devstral Medium
mistralai/devstral-medium
💪 Silné stránky
⚠️ Slabé stránky
Hodnocení podle kategorií
Expertní hodnocení
Devstral Medium je vysoce výkonný model pro generování kódu a agentní usuzování, vyvinutý společně společnostmi Mistral AI a All Hands AI. Je koncipován jako vylepšení oproti Devstral Small a dosahuje 61,6 % na SWE-Bench Verified, čímž v úlohách souvisejících s kódem předčí Gemini 2.5 Pro a GPT-4.1, a to za zlomek nákladů. Je navržen pro generalizaci napříč styly promptů a používání nástrojů v kódových agentech a frameworkách.
Devstral Medium je dostupný pouze přes API (není open-weight) a podporuje nasazení v podnikovém prostředí na soukromé infrastruktuře, s volitelnými možnostmi fine-tuningu.
Unikátní charakteristiky
Devstral Medium vyniká v generování kódu a agentním uvažování, s výkonem srovnatelným s Gemini 2.5 Pro a GPT-4.1 v kódovacích úlohách, ale za zlomek ceny. Je navržen pro generalizaci napříč různými styly promptů a pro použití nástrojů v kódovacích agentech a frameworkách.
Silné stránky
Generování kódu
Dosahuje 61.6% na SWE-Bench Verified, což je lepší než Gemini 2.5 Pro a GPT-4.1.
Cena
Nabízí srovnatelný výkon jako dražší modely (Gemini, GPT-4) za výrazně nižší cenu.
Slabé stránky
Obecná inteligence
Celkové skóre 36.4/100 naznačuje slabší výkon v oblastech mimo kódování a agentní uvažování.
Čeština
MMMLU skóre pro češtinu není k dispozici, což ztěžuje posouzení použitelnosti v českém jazyce.
Srovnání s konkurencí
Gemini 2.5 Flash Image je levnější na vstupu, ale Devstral Medium má lepší kontext a pravděpodobně lepší výkon v kódování.
GPT-5.1 Codex Max je dražší, ale může nabízet lepší obecnou inteligenci a širší škálu schopností (data nejsou k dispozici).
Grok-code-fast-1 je výrazně levnější, ale může mít horší výkon v náročnějších kódovacích úlohách (data nejsou k dispozici).
Deepseek v3.2 je levnější, ale Devstral Medium má větší kontext a pravděpodobně lepší výkon v agentním uvažování.
Doporučení
Cílová skupina
- Vývojáři softwaru
- AI inženýři
Vhodné pro
- Generování kódu
- Automatizace úloh pomocí agentů
Nevhodné pro
- Úlohy vyžadující vysokou úroveň matematických schopností
- Aplikace vyžadující silnou podporu češtiny
Verdikt
Devstral Medium je vhodný pro vývojáře, kteří hledají cenově efektivní řešení pro generování kódu a automatizaci úloh pomocí agentů, ale měli by zvážit jeho omezení v obecné inteligenci a jazykové podpoře.