xAI: Grok 3
x-ai/grok-3
💪 Silné stránky
⚠️ Slabé stránky
Hodnocení podle kategorií
Expertní hodnocení
Grok 3 je nejnovější model od xAI. Je to jejich vlajková loď, která vyniká v podnikových případech použití, jako je extrakce dat, kódování a sumarizace textu. Disponuje hlubokými znalostmi domény ve financích, zdravotnictví, právu a vědě.
Unikátní charakteristiky
Grok 3 je vlajková loď od xAI, zaměřená na podnikové případy použití. Vyniká v oblastech jako je extrakce dat, kódování a shrnutí textu. Má hluboké znalosti v oblastech financí, zdravotnictví, práva a vědy.
Silné stránky
Věda a matematika
Dosahuje vysokých výsledků v náročných vědeckých a matematických úlohách, konkrétně 69.3% v GPQA Diamond a 87.0% v MATH-500.
Obecné znalosti
Solidní výkon v MMLU Pro s 79.9% naznačuje dobré obecné znalosti a schopnost porozumět různým tématům.
Slabé stránky
Rychlost
Velmi nízké TPS (35.7 tokenů/s) a relativně vysoká latence (1.026s) z něj činí pomalý model.
Logické uvažování
Velmi slabý výkon v HLE (5.1%) a Terminalbench Hard (10.6%) naznačuje problémy se složitým logickým uvažováním.
Srovnání s konkurencí
Claude Opus by mohl nabídnout lepší kvalitu, ale za vyšší cenu. Má také větší kontextové okno.
Claude Sonnet nabízí obrovské kontextové okno (1M tokenů) za stejnou cenu, což může být výhodné pro delší dokumenty.
Gemini 3 Pro nabízí obrovské kontextové okno (1M tokenů) a potenciálně lepší multimodální schopnosti (data nejsou k dispozici).
GPT-5.1 může nabídnout lepší poměr cena/výkon, ale data pro přímé srovnání výkonu nejsou k dispozici.
Doporučení
Cílová skupina
- Podniky
- Vědecké instituce
Vhodné pro
- Extrakce dat z dokumentů
- Analýza finančních dat
Nevhodné pro
- Aplikace vyžadující rychlou odezvu
- Složité logické úlohy
Verdikt
Grok 3 je vhodný pro podniky a vědecké instituce, které potřebují model s hlubokými znalostmi v specifických oborech, ale nepožadují rychlou odezvu.