xAI

xAI: Grok 3

x-ai/grok-3
Věda Obecná inteligence
48 /100
Průměrný
💰
Vstup
$3.0/1M
📤
Výstup
$15.0/1M
📏
Kontext
131072
📝
Max výstup
N/A
Vstup: text Výstup: text

💪 Silné stránky

Věda a matematika Dosahuje vysokých výsledků v náročných vědeckých a matematických úlohách, konkrétně 69.3% v GPQA Diamond a 87.0% v MATH-500.
Obecné znalosti Solidní výkon v MMLU Pro s 79.9% naznačuje dobré obecné znalosti a schopnost porozumět různým tématům.

⚠️ Slabé stránky

Rychlost Velmi nízké TPS (35.7 tokenů/s) a relativně vysoká latence (1.026s) z něj činí pomalý model.
Logické uvažování Velmi slabý výkon v HLE (5.1%) a Terminalbench Hard (10.6%) naznačuje problémy se složitým logickým uvažováním.

Hodnocení podle kategorií

🧮
Věda & Matematika
58.3
Průměrný
💻
Programování
42.5
Průměrný
🤖
Agenti & Nástroje
48.8
Průměrný
🧠
Obecná inteligence
51.9
Průměrný
Rychlost
8.9
Slabý

Expertní hodnocení

🎯
Killer Feature
Hluboké znalosti v oborech jako finance, zdravotnictví, právo a věda.
Skryté riziko
Pomalá inference může omezit použitelnost v interaktivních aplikacích.
Doporučený scénář
Analýza a shrnutí odborných textů, kde rychlost není kritická.

Grok 3 je nejnovější model od xAI. Je to jejich vlajková loď, která vyniká v podnikových případech použití, jako je extrakce dat, kódování a sumarizace textu. Disponuje hlubokými znalostmi domény ve financích, zdravotnictví, právu a vědě.

Unikátní charakteristiky

Grok 3 je vlajková loď od xAI, zaměřená na podnikové případy použití. Vyniká v oblastech jako je extrakce dat, kódování a shrnutí textu. Má hluboké znalosti v oblastech financí, zdravotnictví, práva a vědy.

Silné stránky

Věda a matematika

Dosahuje vysokých výsledků v náročných vědeckých a matematických úlohách, konkrétně 69.3% v GPQA Diamond a 87.0% v MATH-500.

Obecné znalosti

Solidní výkon v MMLU Pro s 79.9% naznačuje dobré obecné znalosti a schopnost porozumět různým tématům.

Slabé stránky

Rychlost

Velmi nízké TPS (35.7 tokenů/s) a relativně vysoká latence (1.026s) z něj činí pomalý model.

Logické uvažování

Velmi slabý výkon v HLE (5.1%) a Terminalbench Hard (10.6%) naznačuje problémy se složitým logickým uvažováním.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5
Dražší vstup i výstup

Claude Opus by mohl nabídnout lepší kvalitu, ale za vyšší cenu. Má také větší kontextové okno.

ANTHROPIC anthropic/claude-sonnet-4.5
Stejná cena vstupu i výstupu

Claude Sonnet nabízí obrovské kontextové okno (1M tokenů) za stejnou cenu, což může být výhodné pro delší dokumenty.

GOOGLE google/gemini-3-pro-preview
Levnější vstup, podobný výstup

Gemini 3 Pro nabízí obrovské kontextové okno (1M tokenů) a potenciálně lepší multimodální schopnosti (data nejsou k dispozici).

OPENAI openai/gpt-5.1
Výrazně levnější vstup i výstup

GPT-5.1 může nabídnout lepší poměr cena/výkon, ale data pro přímé srovnání výkonu nejsou k dispozici.

Doporučení

Cílová skupina

  • Podniky
  • Vědecké instituce

Vhodné pro

  • Extrakce dat z dokumentů
  • Analýza finančních dat

Nevhodné pro

  • Aplikace vyžadující rychlou odezvu
  • Složité logické úlohy

Verdikt

Grok 3 je vhodný pro podniky a vědecké instituce, které potřebují model s hlubokými znalostmi v specifických oborech, ale nepožadují rychlou odezvu.