Mistral: Mistral Medium 3
mistralai/mistral-medium-3
💪 Silné stránky
⚠️ Slabé stránky
Hodnocení podle kategorií
Expertní hodnocení
Mistral Medium 3 je vysoce výkonný jazykový model podnikové třídy navržený tak, aby poskytoval možnosti na špičkové úrovni při výrazně snížených provozních nákladech. Vyvažuje nejmodernější usuzování a multimodální výkon s 8× nižšími náklady ve srovnání s tradičními velkými modely, díky čemuž je vhodný pro škálovatelná nasazení v profesionálních a průmyslových případech použití.
Model vyniká v oblastech, jako je kódování, STEM usuzování a podniková adaptace. Podporuje hybridní, on-prem a in-VPC nasazení a je optimalizován pro integraci do vlastních pracovních postupů. Mistral Medium 3 nabízí konkurenceschopnou přesnost ve srovnání s většími modely, jako jsou Claude Sonnet 3.5/3.7, Llama 4 Maverick a Command R+, přičemž si zachovává širokou kompatibilitu napříč cloudovými prostředími.
Unikátní charakteristiky
Mistral Medium 3 se zaměřuje na vyvážení výkonu a ceny, nabízí multimodální schopnosti (text, image → text) a velký kontext 131 072 tokenů. Vyniká ve vědeckých a matematických úlohách, což dokazuje vysoké skóre v MATH-500 (90.7%) a GPQA Diamond (57.8%).
Silné stránky
Věda a matematika
Vysoké skóre v matematických úlohách, zejména MATH-500 (90.7%) a GPQA Diamond (57.8%), naznačuje silné schopnosti v STEM oblastech.
Cena a výkon
Nabízí konkurenceschopný výkon za nižší cenu ve srovnání s většími modely, což z něj činí atraktivní volbu pro nasazení ve velkém měřítku.
Slabé stránky
Logické uvažování
Slabé výsledky v HLE (4.3%) a terminalbench_hard (3.5%) naznačují omezené schopnosti v oblasti hard logic.
Čeština
MMMLU skóre pro češtinu není k dispozici, takže nelze posoudit kvalitu modelu v tomto jazyce.
Srovnání s konkurencí
Claude Sonnet 4.5 má větší kontext (1,000,000 tokenů) a může být lepší v komplexnějších úlohách, ale je výrazně dražší.
Gemini 3 Pro Image Preview nabízí multimodální schopnosti, ale s menším kontextem (65,536 tokenů) a vyšší cenou za výstup.
Grok-4.1-fast je levnější a má větší kontext (2,000,000 tokenů), ale jeho výkon v benchmarkách není znám.
Ministral-14b-2512 je levnější, ale jeho výkon v benchmarkách není k dispozici.
Doporučení
Cílová skupina
- Výzkumníci
- Podniky s omezeným rozpočtem
- Vývojáři aplikací
Vhodné pro
- Matematické modelování
- Analýza dat
- Generování kódu
Nevhodné pro
- Úlohy vyžadující silné logické uvažování
- Aplikace s vysokými nároky na češtinu
Verdikt
Mistral Medium 3 je vhodný pro uživatele, kteří hledají cenově dostupný model s dobrým výkonem v oblasti vědy a matematiky, ale měli by zvážit jeho omezení v logickém uvažování.