Meta 30. 04. 2025

Meta: Llama Guard 4 12B

meta-llama/llama-guard-4-12b

Bezpečnost obsahu Multimodální moderace

💰

Vstup

$0.18/1M

📤

Výstup

$0.18/1M

📏

Kontext

163840

📝

Max výstup

N/A

Vstup: image text → Výstup: text

💪 Silné stránky

Bezpečnost obsahu Specializuje se na detekci nebezpečného obsahu v textu a obrázcích, což je klíčové pro bezpečné nasazení LLM.

Multimodálnost Podporuje kombinaci textových a obrazových vstupů, což rozšiřuje možnosti moderování obsahu.

⚠️ Slabé stránky

Nedostatek benchmarků Chybí veřejně dostupné benchmarky, takže nelze objektivně porovnat jeho výkon s konkurencí.

Obecné LLM schopnosti Není určen pro generování obsahu, ale pro jeho moderování, takže jeho obecné LLM schopnosti jsou omezené.

Expertní hodnocení

🎯

Killer Feature

Specializace na bezpečnost obsahu a multimodální moderace.

⚡

Skryté riziko

Závislost na kvalitě trénovacích dat pro detekci nebezpečného obsahu.

✅

Doporučený scénář

Automatické filtrování nebezpečných obrázků a textů na sociálních sítích.

Llama Guard 4 je multimodální předtrénovaný model odvozený od Llama 4 Scout, jemně doladěný pro klasifikaci obsahu z hlediska bezpečnosti. Podobně jako předchozí verze, může být použit ke klasifikaci obsahu jak ve vstupech LLM (klasifikace promptu), tak v odpovědích LLM (klasifikace odpovědi). Funguje jako LLM – generuje text ve svém výstupu, který indikuje, zda je daný prompt nebo odpověď bezpečný nebo nebezpečný, a pokud je nebezpečný, také vypisuje kategorie obsahu, které byly porušeny.

Llama Guard 4 byl vyladěn tak, aby chránil proti standardizované taxonomii rizik MLCommons a byl navržen tak, aby podporoval multimodální schopnosti Llama 4. Konkrétně kombinuje funkce z předchozích modelů Llama Guard, poskytuje moderování obsahu pro angličtinu a více podporovaných jazyků, spolu s vylepšenými schopnostmi pro zpracování smíšených textově-obrazových promptů, včetně více obrázků. Kromě toho je Llama Guard 4 integrován do Llama Moderations API, čímž rozšiřuje robustní klasifikaci bezpečnosti na text a obrázky.

Unikátní charakteristiky

Llama Guard 4 je model pro klasifikaci bezpečnosti obsahu, který podporuje multimodální vstupy (text a obrázky). Je navržen pro moderování obsahu v LLM vstupech a výstupech. Benchmark data nejsou k dispozici, takže nelze přesně určit jeho výkon.

Silné stránky

Bezpečnost obsahu

Specializuje se na detekci nebezpečného obsahu v textu a obrázcích, což je klíčové pro bezpečné nasazení LLM.

Multimodálnost

Podporuje kombinaci textových a obrazových vstupů, což rozšiřuje možnosti moderování obsahu.

Slabé stránky

Nedostatek benchmarků

Chybí veřejně dostupné benchmarky, takže nelze objektivně porovnat jeho výkon s konkurencí.

Obecné LLM schopnosti

Není určen pro generování obsahu, ale pro jeho moderování, takže jeho obecné LLM schopnosti jsou omezené.

Srovnání s konkurencí

GOOGLE google/gemini-2.5-flash-image

1.6x dražší vstup, 13.8x dražší výstup

Gemini 2.5 Flash Image je multimodální model, ale jeho primární zaměření je širší než jen bezpečnost obsahu.

ANTHROPIC anthropic/claude-haiku-4.5

5.5x dražší vstup, 27.7x dražší výstup

Claude Haiku 4.5 je rychlejší a levnější pro obecné účely, ale nemá specializaci na bezpečnost obsahu.

MISTRALAI mistralai/ministral-3b-2512

1.8x levnější vstup, 1.8x levnější výstup

Ministral 3B je levnější, ale není specializovaný na bezpečnost obsahu a nemá multimodální schopnosti.

DEEPSEEK deepseek/deepseek-v3.2-exp

1.16x dražší vstup, 1.77x dražší výstup

Deepseek V3.2 EXP je model pro obecné účely, nemá specializaci na bezpečnost obsahu a nemá multimodální schopnosti.

Doporučení

Cílová skupina

Vývojáři LLM aplikací
Platformy pro sdílení obsahu

Vhodné pro

Moderování uživatelského obsahu
Filtrování nebezpečných vstupů a výstupů LLM

Nevhodné pro

Generování kreativního obsahu
Úkoly vyžadující hluboké porozumění jazyku

Verdikt

Llama Guard 4 je užitečný nástroj pro vývojáře, kteří potřebují moderovat obsah generovaný LLM, zejména v multimodálních aplikacích. Chybějící benchmarky ale ztěžují objektivní srovnání s konkurencí.