xAI 10. 06. 2025

xAI: Grok 3

x-ai/grok-3

Věda Obecná inteligence

48 /100

Průměrný

💰

Vstup

$3.0/1M

📤

Výstup

$15.0/1M

📏

Kontext

131072

📝

Max výstup

N/A

Vstup: text → Výstup: text

💪 Silné stránky

Věda a matematika Dosahuje vysokých výsledků v náročných vědeckých a matematických úlohách, konkrétně 69.3% v GPQA Diamond a 87.0% v MATH-500.

Obecné znalosti Solidní výkon v MMLU Pro s 79.9% naznačuje dobré obecné znalosti a schopnost porozumět různým tématům.

⚠️ Slabé stránky

Rychlost Velmi nízké TPS (35.7 tokenů/s) a relativně vysoká latence (1.026s) z něj činí pomalý model.

Logické uvažování Velmi slabý výkon v HLE (5.1%) a Terminalbench Hard (10.6%) naznačuje problémy se složitým logickým uvažováním.

Hodnocení podle kategorií

🧮

Věda & Matematika

58.3

Průměrný

💻

Programování

42.5

Průměrný

🤖

Agenti & Nástroje

48.8

Průměrný

🧠

Obecná inteligence

51.9

Průměrný

⚡

Rychlost

8.9

Slabý

Expertní hodnocení

🎯

Killer Feature

Hluboké znalosti v oborech jako finance, zdravotnictví, právo a věda.

⚡

Skryté riziko

Pomalá inference může omezit použitelnost v interaktivních aplikacích.

✅

Doporučený scénář

Analýza a shrnutí odborných textů, kde rychlost není kritická.

Grok 3 je nejnovější model od xAI. Je to jejich vlajková loď, která vyniká v podnikových případech použití, jako je extrakce dat, kódování a sumarizace textu. Disponuje hlubokými znalostmi domény ve financích, zdravotnictví, právu a vědě.

Unikátní charakteristiky

Grok 3 je vlajková loď od xAI, zaměřená na podnikové případy použití. Vyniká v oblastech jako je extrakce dat, kódování a shrnutí textu. Má hluboké znalosti v oblastech financí, zdravotnictví, práva a vědy.

Silné stránky

Věda a matematika

Dosahuje vysokých výsledků v náročných vědeckých a matematických úlohách, konkrétně 69.3% v GPQA Diamond a 87.0% v MATH-500.

Obecné znalosti

Solidní výkon v MMLU Pro s 79.9% naznačuje dobré obecné znalosti a schopnost porozumět různým tématům.

Slabé stránky

Rychlost

Velmi nízké TPS (35.7 tokenů/s) a relativně vysoká latence (1.026s) z něj činí pomalý model.

Logické uvažování

Velmi slabý výkon v HLE (5.1%) a Terminalbench Hard (10.6%) naznačuje problémy se složitým logickým uvažováním.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5

Dražší vstup i výstup

Claude Opus by mohl nabídnout lepší kvalitu, ale za vyšší cenu. Má také větší kontextové okno.

ANTHROPIC anthropic/claude-sonnet-4.5

Stejná cena vstupu i výstupu

Claude Sonnet nabízí obrovské kontextové okno (1M tokenů) za stejnou cenu, což může být výhodné pro delší dokumenty.

GOOGLE google/gemini-3-pro-preview

Levnější vstup, podobný výstup

Gemini 3 Pro nabízí obrovské kontextové okno (1M tokenů) a potenciálně lepší multimodální schopnosti (data nejsou k dispozici).

OPENAI openai/gpt-5.1

Výrazně levnější vstup i výstup

GPT-5.1 může nabídnout lepší poměr cena/výkon, ale data pro přímé srovnání výkonu nejsou k dispozici.

Doporučení

Cílová skupina

Podniky
Vědecké instituce

Vhodné pro

Extrakce dat z dokumentů
Analýza finančních dat

Nevhodné pro

Aplikace vyžadující rychlou odezvu
Složité logické úlohy

Verdikt

Grok 3 je vhodný pro podniky a vědecké instituce, které potřebují model s hlubokými znalostmi v specifických oborech, ale nepožadují rychlou odezvu.