Mistral

Mistral: Mistral Medium 3

mistralai/mistral-medium-3
Kódování STEM reasoning
44 /100
Průměrný
💰
Vstup
$0.4/1M
📤
Výstup
$2.0/1M
📏
Kontext
131072
📝
Max výstup
N/A
Vstup: text image Výstup: text

💪 Silné stránky

Věda a matematika Vysoké skóre v matematických úlohách, zejména MATH-500 (90.7%) a GPQA Diamond (57.8%), naznačuje silné schopnosti v STEM oblastech.
Cena a výkon Nabízí konkurenceschopný výkon za nižší cenu ve srovnání s většími modely, což z něj činí atraktivní volbu pro nasazení ve velkém měřítku.

⚠️ Slabé stránky

Logické uvažování Slabé výsledky v HLE (4.3%) a terminalbench_hard (3.5%) naznačují omezené schopnosti v oblasti hard logic.
Čeština MMMLU skóre pro češtinu není k dispozici, takže nelze posoudit kvalitu modelu v tomto jazyce.

Hodnocení podle kategorií

🧮
Věda & Matematika
58.9
Průměrný
💻
Programování
40.0
Průměrný
🤖
Agenti & Nástroje
24.3
Slabý
🧠
Obecná inteligence
49.1
Průměrný
Rychlost
50.3
Průměrný

Expertní hodnocení

🎯
Killer Feature
Vynikající poměr cena/výkon pro vědecké a matematické úlohy.
Skryté riziko
Slabé logické uvažování může omezit použitelnost v komplexních úlohách.
Doporučený scénář
Generování a validace matematických modelů.

Mistral Medium 3 je vysoce výkonný jazykový model podnikové třídy navržený tak, aby poskytoval možnosti na špičkové úrovni při výrazně snížených provozních nákladech. Vyvažuje nejmodernější usuzování a multimodální výkon s 8× nižšími náklady ve srovnání s tradičními velkými modely, díky čemuž je vhodný pro škálovatelná nasazení v profesionálních a průmyslových případech použití.

Model vyniká v oblastech, jako je kódování, STEM usuzování a podniková adaptace. Podporuje hybridní, on-prem a in-VPC nasazení a je optimalizován pro integraci do vlastních pracovních postupů. Mistral Medium 3 nabízí konkurenceschopnou přesnost ve srovnání s většími modely, jako jsou Claude Sonnet 3.5/3.7, Llama 4 Maverick a Command R+, přičemž si zachovává širokou kompatibilitu napříč cloudovými prostředími.

Unikátní charakteristiky

Mistral Medium 3 se zaměřuje na vyvážení výkonu a ceny, nabízí multimodální schopnosti (text, image → text) a velký kontext 131 072 tokenů. Vyniká ve vědeckých a matematických úlohách, což dokazuje vysoké skóre v MATH-500 (90.7%) a GPQA Diamond (57.8%).

Silné stránky

Věda a matematika

Vysoké skóre v matematických úlohách, zejména MATH-500 (90.7%) a GPQA Diamond (57.8%), naznačuje silné schopnosti v STEM oblastech.

Cena a výkon

Nabízí konkurenceschopný výkon za nižší cenu ve srovnání s většími modely, což z něj činí atraktivní volbu pro nasazení ve velkém měřítku.

Slabé stránky

Logické uvažování

Slabé výsledky v HLE (4.3%) a terminalbench_hard (3.5%) naznačují omezené schopnosti v oblasti hard logic.

Čeština

MMMLU skóre pro češtinu není k dispozici, takže nelze posoudit kvalitu modelu v tomto jazyce.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-sonnet-4.5
3.75x dražší vstup, 7.5x dražší výstup

Claude Sonnet 4.5 má větší kontext (1,000,000 tokenů) a může být lepší v komplexnějších úlohách, ale je výrazně dražší.

GOOGLE google/gemini-3-pro-image-preview
5x dražší výstup

Gemini 3 Pro Image Preview nabízí multimodální schopnosti, ale s menším kontextem (65,536 tokenů) a vyšší cenou za výstup.

X-AI x-ai/grok-4.1-fast
2x levnější vstup, 4x levnější výstup

Grok-4.1-fast je levnější a má větší kontext (2,000,000 tokenů), ale jeho výkon v benchmarkách není znám.

MISTRALAI mistralai/ministral-14b-2512
2x levnější vstup i výstup

Ministral-14b-2512 je levnější, ale jeho výkon v benchmarkách není k dispozici.

Doporučení

Cílová skupina

  • Výzkumníci
  • Podniky s omezeným rozpočtem
  • Vývojáři aplikací

Vhodné pro

  • Matematické modelování
  • Analýza dat
  • Generování kódu

Nevhodné pro

  • Úlohy vyžadující silné logické uvažování
  • Aplikace s vysokými nároky na češtinu

Verdikt

Mistral Medium 3 je vhodný pro uživatele, kteří hledají cenově dostupný model s dobrým výkonem v oblasti vědy a matematiky, ale měli by zvážit jeho omezení v logickém uvažování.