Meta 05. 04. 2025

Meta: Llama 4 Maverick

meta-llama/llama-4-maverick

Multimodální interakce Vysoká propustnost

44 /100

Průměrný

💰

Vstup

$0.136/1M

📤

Výstup

$0.68/1M

📏

Kontext

1048576

📝

Max výstup

8192

Vstup: text image → Výstup: text

💪 Silné stránky

Věda a matematika Vynikající výsledky ve vědeckých a matematických benchmarkách, jako je GPQA Diamond (67.1%) a MATH-500 (88.9%).

Kontextové okno Velké kontextové okno (1,048,576 tokenů) umožňuje zpracovávat rozsáhlé dokumenty a složité konverzace.

⚠️ Slabé stránky

Programování Slabší výsledky v programovacích benchmarkách (LiveCodeBench 39.7%).

Logické uvažování Velmi nízké skóre v benchmarku HLE (4.8%) naznačuje problémy s hard logic.

Hodnocení podle kategorií

🧮

Věda & Matematika

60.2

Dobrý

💻

Programování

39.7

Slabý

🤖

Agenti & Nástroje

17.8

Slabý

🧠

Obecná inteligence

52.4

Průměrný

⚡

Rychlost

61.4

Dobrý

Expertní hodnocení

🎯

Killer Feature

Velké kontextové okno a multimodální schopnosti

⚡

Skryté riziko

Slabší logické uvažování a programovací schopnosti mohou omezit použitelnost v některých aplikacích.

✅

Doporučený scénář

Analýza vědeckých článků a extrakce informací z obrázků.

Llama 4 Maverick 17B Instruct (128E) je velkokapacitní multimodální jazykový model od společnosti Meta, postavený na architektuře mixture-of-experts (MoE) se 128 experty a 17 miliardami aktivních parametrů na jeden průchod dopřednou sítí (celkem 400B). Podporuje multijazyčný textový a obrazový vstup a produkuje multijazyčný textový a kódový výstup ve 12 podporovaných jazycích. Maverick, optimalizovaný pro úlohy vidění a jazyka, je doladěn pomocí instrukcí pro chování podobné asistentovi, obrazové usuzování a všeobecnou multimodální interakci.

Maverick využívá ranou fúzi pro nativní multimodalitu a kontextové okno o velikosti 1 milionu tokenů. Byl trénován na kurátorské směsi veřejných, licencovaných a Meta-platform dat, pokrývající ~22 bilionů tokenů, s datovým cut-off v srpnu 2024. Maverick, vydaný 5. dubna 2025 pod licencí Llama 4 Community License, je vhodný pro výzkumné a komerční aplikace vyžadující pokročilé multimodální porozumění a vysokou propustnost modelu.

Unikátní charakteristiky

Llama 4 Maverick je multimodální model s velkým kontextovým oknem (1 milion tokenů) a architekturou MoE. Vyniká ve vědeckých úlohách (GPQA Diamond 67.1%, MATH-500 88.9%), ale má slabší výsledky v logice a programování.

Silné stránky

Věda a matematika

Vynikající výsledky ve vědeckých a matematických benchmarkách, jako je GPQA Diamond (67.1%) a MATH-500 (88.9%).

Kontextové okno

Velké kontextové okno (1,048,576 tokenů) umožňuje zpracovávat rozsáhlé dokumenty a složité konverzace.

Slabé stránky

Programování

Slabší výsledky v programovacích benchmarkách (LiveCodeBench 39.7%).

Logické uvažování

Velmi nízké skóre v benchmarku HLE (4.8%) naznačuje problémy s hard logic.

Srovnání s konkurencí

Anthropic anthropic/claude-opus-4.5

Výrazně dražší (cca 35x vstup, 36x výstup)

Claude Opus je silnější v obecné inteligenci, ale dražší.

Google google/gemini-3-pro-preview

Dražší (cca 14x vstup, 17x výstup)

Gemini 3 Pro nabízí multimodální schopnosti, ale za vyšší cenu.

X-AI x-ai/grok-4.1-fast

Levnější (cca 1.4x vstup, 2.7x levnější výstup)

Grok nabízí větší kontextové okno a nižší cenu, ale pravděpodobně nižší výkon v náročnějších úlohách.

MistralAI mistralai/ministral-14b-2512

Podobná cena vstupu, výrazně levnější výstup

Ministral 14B je levnější na výstup, ale nemá multimodální schopnosti.

Doporučení

Cílová skupina

Výzkumníci
Data scientists

Vhodné pro

Analýza vědeckých dat
Zpracování rozsáhlých dokumentů

Nevhodné pro

Vývoj aplikací vyžadujících robustní logické uvažování
Úkoly s vysokými nároky na programování

Verdikt

Llama 4 Maverick je vhodný pro výzkumníky a data scientisty, kteří potřebují zpracovávat velké objemy dat a využívat multimodální vstupy, ale měli by zvážit jeho slabší stránky v logice a programování.