Mistral 10. 07. 2025

Mistral: Devstral Small 1.1

mistralai/devstral-small

Programování Agenti

33 /100

Slabý

💰

Vstup

$0.07/1M

📤

Výstup

$0.28/1M

📏

Kontext

128000

📝

Max výstup

N/A

Vstup: text → Výstup: text

💪 Silné stránky

Programování Vyniká v úlohách spojených s programováním, což dokazuje skóre 53.6% na SWE-Bench Verified.

Dlouhý kontext Disponuje kontextovým oknem 128k tokenů, což umožňuje zpracovávat rozsáhlé dokumenty a kódové báze.

⚠️ Slabé stránky

Obecná inteligence Celkové skóre 35.7/100 naznačuje slabší výkon v obecných úlohách a znalostech.

Čeština Nedostupnost dat pro češtinu (MMMLU) znemožňuje posoudit jeho schopnosti v tomto jazyce.

Hodnocení podle kategorií

🧮

Věda & Matematika

29.4

Slabý

💻

Programování

25.4

Slabý

🤖

Agenti & Nástroje

28.4

Slabý

🧠

Obecná inteligence

40.3

Průměrný

⚡

Rychlost

74.6

Dobrý

Expertní hodnocení

🎯

Killer Feature

Optimalizace pro agentní kódovací workflow

⚡

Skryté riziko

Slabší výkon v obecných znalostech a úlohách mimo programování

✅

Doporučený scénář

Vývoj autonomních agentů pro úpravu a správu kódu

Devstral Small 1.1 je 24B parametrový jazykový model s otevřenými váhami pro agenty softwarového inženýrství, vyvinutý společností Mistral AI ve spolupráci s All Hands AI. Je doladěn z Mistral Small 3.1 a uvolněn pod licencí Apache 2.0. Disponuje kontextovým oknem o velikosti 128k tokenů a podporuje jak funkci volání ve stylu Mistral, tak výstupní formáty XML.

Devstral Small 1.1, navržený pro agentní pracovní postupy kódování, je optimalizován pro úkoly, jako je průzkum codebase, úpravy více souborů a integrace do autonomních vývojových agentů, jako jsou OpenHands a Cline. Dosahuje 53,6 % na SWE-Bench Verified, čímž překonává všechny ostatní otevřené modely v tomto benchmarku, a přitom zůstává dostatečně nenáročný, aby běžel na jedné GPU 4090 nebo zařízení Apple Silicon. Model používá Tekken tokenizer se 131k slovníkem a je nasaditelný prostřednictvím vLLM, Transformers, Ollama, LM Studio a dalších běhových prostředí kompatibilních s OpenAI.

Unikátní charakteristiky

Devstral Small 1.1 je optimalizován pro agentní kódovací workflow, dosahuje 53.6% na SWE-Bench Verified. Má kontextové okno 128k tokenů a podporuje Mistral-style function calling a XML výstupní formáty.

Silné stránky

Programování

Vyniká v úlohách spojených s programováním, což dokazuje skóre 53.6% na SWE-Bench Verified.

Dlouhý kontext

Disponuje kontextovým oknem 128k tokenů, což umožňuje zpracovávat rozsáhlé dokumenty a kódové báze.

Slabé stránky

Obecná inteligence

Celkové skóre 35.7/100 naznačuje slabší výkon v obecných úlohách a znalostech.

Čeština

Nedostupnost dat pro češtinu (MMMLU) znemožňuje posoudit jeho schopnosti v tomto jazyce.

Srovnání s konkurencí

X-AI x-ai/grok-code-fast-1

1.6x levnější vstup, 5x levnější výstup

Grok-code-fast-1 má větší kontext (256k) a je levnější, ale Devstral Small 1.1 může mít lepší výkon v specifických úlohách agentního kódování.

MISTRALAI mistralai/ministral-3b-2512

1.2x levnější vstup, 2.8x levnější výstup

Ministral-3b-2512 je výrazně levnější, ale Devstral Small 1.1 má pravděpodobně lepší výkon a delší kontext.

DEEPSEEK deepseek/deepseek-v3.2-exp

1.75x levnější vstup, 0.875x levnější výstup

Deepseek-v3.2-exp je cenově srovnatelný, ale Devstral Small 1.1 má delší kontext a může být lépe optimalizován pro agentní kódování.

OPENAI openai/gpt-5.1-chat

10.4x dražší vstup, 35.7x dražší výstup

GPT-5.1-chat je výrazně dražší, ale může nabízet lepší obecnou inteligenci a širší škálu schopností. Kontext je stejný.

Doporučení

Cílová skupina

Vývojáři softwaru
Výzkumníci v oblasti umělé inteligence

Vhodné pro

Autonomní vývoj softwaru
Automatizace kódovacích úloh

Nevhodné pro

Obecné úkoly vyžadující rozsáhlé znalosti
Aplikace vyžadující silnou podporu češtiny

Verdikt

Devstral Small 1.1 je vhodný pro vývojáře a výzkumníky, kteří se zaměřují na agentní kódovací workflow a potřebují model optimalizovaný pro automatizaci úloh spojených s programováním. Je třeba zvážit jeho slabší výkon v obecných znalostech a nedostupnost dat pro češtinu.