Mistral: Mistral Small 3.2 24B
mistralai/mistral-small-3.2-24b-instruct
💪 Silné stránky
⚠️ Slabé stránky
Expertní hodnocení
Mistral-Small-3.2-24B-Instruct-2506 je aktualizovaný 24B parametrový model od Mistralu, optimalizovaný pro sledování instrukcí, redukci opakování a vylepšené volání funkcí. Oproti verzi 3.1, verze 3.2 významně zlepšuje přesnost na WildBench a Arena Hard, redukuje nekonečné generování a přináší zlepšení v používání nástrojů a úlohách se strukturovaným výstupem.
Podporuje obrazové a textové vstupy se strukturovanými výstupy, volání funkcí/nástrojů a silný výkon v kódování (HumanEval+, MBPP), STEM (MMLU, MATH, GPQA) a vizuálních benchmarkách (ChartQA, DocVQA).
Unikátní charakteristiky
Mistral Small 3.2 je 24B model optimalizovaný pro sledování instrukcí, redukci opakování a vylepšené volání funkcí. Verze 3.2 přináší významné zlepšení přesnosti na WildBench a Arena Hard, snižuje nekonečné generování a zlepšuje využití nástrojů a strukturované výstupy. Podporuje obrazové a textové vstupy se strukturovanými výstupy a silný výkon v kódování, STEM a vizuálních benchmarkách.
Silné stránky
Multimodalita
Podporuje obrazové a textové vstupy, což rozšiřuje možnosti použití.
Dlouhý kontext
Kontext 131,072 tokenů umožňuje zpracovávat rozsáhlé dokumenty a komplexní konverzace.
Slabé stránky
Cena
Cena je vyšší než u některých konkurenčních modelů s podobnými parametry.
Benchmarky
Benchmark data nejsou k dispozici, což ztěžuje objektivní srovnání s konkurencí.
Srovnání s konkurencí
Claude Sonnet 4.5 má větší kontext a pravděpodobně lepší výkon, ale je výrazně dražší.
Gemini 3 Pro Image Preview nabízí multimodalitu, ale má menší kontext a je dražší.
Grok-4.1-fast má obrovský kontext a je levnější, ale nemusí dosahovat stejné kvality výstupu.
Ministral-14b-2512 má větší kontext a může mít lepší výkon, ale je dražší.
Doporučení
Cílová skupina
- Vývojáři aplikací s multimodálním vstupem
- Firmy potřebující zpracovávat velké objemy textu
Vhodné pro
- Chatboti s podporou obrázků
- Analýza dokumentů s obrázky a textem
Nevhodné pro
- Aplikace s extrémně nízkým rozpočtem
- Úkoly vyžadující maximální rychlost inference
Verdikt
Mistral Small 3.2 je vhodný pro uživatele, kteří potřebují multimodalitu a dlouhý kontext, ale jsou ochotni zaplatit vyšší cenu a akceptovat nedostatek benchmark dat.