Mistral 07. 05. 2025

Mistral: Mistral Medium 3

mistralai/mistral-medium-3

Kódování STEM reasoning

44 /100

Průměrný

💰

Vstup

$0.4/1M

📤

Výstup

$2.0/1M

📏

Kontext

131072

📝

Max výstup

N/A

Vstup: text image → Výstup: text

💪 Silné stránky

Věda a matematika Vysoké skóre v matematických úlohách, zejména MATH-500 (90.7%) a GPQA Diamond (57.8%), naznačuje silné schopnosti v STEM oblastech.

Cena a výkon Nabízí konkurenceschopný výkon za nižší cenu ve srovnání s většími modely, což z něj činí atraktivní volbu pro nasazení ve velkém měřítku.

⚠️ Slabé stránky

Logické uvažování Slabé výsledky v HLE (4.3%) a terminalbench_hard (3.5%) naznačují omezené schopnosti v oblasti hard logic.

Čeština MMMLU skóre pro češtinu není k dispozici, takže nelze posoudit kvalitu modelu v tomto jazyce.

Hodnocení podle kategorií

🧮

Věda & Matematika

58.9

Průměrný

💻

Programování

40.0

Průměrný

🤖

Agenti & Nástroje

24.3

Slabý

🧠

Obecná inteligence

49.1

Průměrný

⚡

Rychlost

50.3

Průměrný

Expertní hodnocení

🎯

Killer Feature

Vynikající poměr cena/výkon pro vědecké a matematické úlohy.

⚡

Skryté riziko

Slabé logické uvažování může omezit použitelnost v komplexních úlohách.

✅

Doporučený scénář

Generování a validace matematických modelů.

Mistral Medium 3 je vysoce výkonný jazykový model podnikové třídy navržený tak, aby poskytoval možnosti na špičkové úrovni při výrazně snížených provozních nákladech. Vyvažuje nejmodernější usuzování a multimodální výkon s 8× nižšími náklady ve srovnání s tradičními velkými modely, díky čemuž je vhodný pro škálovatelná nasazení v profesionálních a průmyslových případech použití.

Model vyniká v oblastech, jako je kódování, STEM usuzování a podniková adaptace. Podporuje hybridní, on-prem a in-VPC nasazení a je optimalizován pro integraci do vlastních pracovních postupů. Mistral Medium 3 nabízí konkurenceschopnou přesnost ve srovnání s většími modely, jako jsou Claude Sonnet 3.5/3.7, Llama 4 Maverick a Command R+, přičemž si zachovává širokou kompatibilitu napříč cloudovými prostředími.

Unikátní charakteristiky

Mistral Medium 3 se zaměřuje na vyvážení výkonu a ceny, nabízí multimodální schopnosti (text, image → text) a velký kontext 131 072 tokenů. Vyniká ve vědeckých a matematických úlohách, což dokazuje vysoké skóre v MATH-500 (90.7%) a GPQA Diamond (57.8%).

Silné stránky

Věda a matematika

Vysoké skóre v matematických úlohách, zejména MATH-500 (90.7%) a GPQA Diamond (57.8%), naznačuje silné schopnosti v STEM oblastech.

Cena a výkon

Nabízí konkurenceschopný výkon za nižší cenu ve srovnání s většími modely, což z něj činí atraktivní volbu pro nasazení ve velkém měřítku.

Slabé stránky

Logické uvažování

Slabé výsledky v HLE (4.3%) a terminalbench_hard (3.5%) naznačují omezené schopnosti v oblasti hard logic.

Čeština

MMMLU skóre pro češtinu není k dispozici, takže nelze posoudit kvalitu modelu v tomto jazyce.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-sonnet-4.5

3.75x dražší vstup, 7.5x dražší výstup

Claude Sonnet 4.5 má větší kontext (1,000,000 tokenů) a může být lepší v komplexnějších úlohách, ale je výrazně dražší.

GOOGLE google/gemini-3-pro-image-preview

5x dražší výstup

Gemini 3 Pro Image Preview nabízí multimodální schopnosti, ale s menším kontextem (65,536 tokenů) a vyšší cenou za výstup.

X-AI x-ai/grok-4.1-fast

2x levnější vstup, 4x levnější výstup

Grok-4.1-fast je levnější a má větší kontext (2,000,000 tokenů), ale jeho výkon v benchmarkách není znám.

MISTRALAI mistralai/ministral-14b-2512

2x levnější vstup i výstup

Ministral-14b-2512 je levnější, ale jeho výkon v benchmarkách není k dispozici.

Doporučení

Cílová skupina

Výzkumníci
Podniky s omezeným rozpočtem
Vývojáři aplikací

Vhodné pro

Matematické modelování
Analýza dat
Generování kódu

Nevhodné pro

Úlohy vyžadující silné logické uvažování
Aplikace s vysokými nároky na češtinu

Verdikt

Mistral Medium 3 je vhodný pro uživatele, kteří hledají cenově dostupný model s dobrým výkonem v oblasti vědy a matematiky, ale měli by zvážit jeho omezení v logickém uvažování.