xAI

xAI: Grok 4

x-ai/grok-4
Matematika Věda Programování
74 /100
Dobrý
💰
Vstup
$3.0/1M
📤
Výstup
$15.0/1M
📏
Kontext
256000
📝
Max výstup
N/A
Vstup: image text Výstup: text

💪 Silné stránky

Matematika Excelentní výkon v matematických úlohách, s 99.0% v MATH-500 a 94.3% v AIME 2025.
Věda Vysoké skóre v GPQA Diamond (87.7%) naznačuje silné schopnosti v oblasti vědeckého uvažování.

⚠️ Slabé stránky

Rychlost Nízká rychlost zpracování, s TPS 41.2 a TTFT 6.181s, omezuje použitelnost v aplikacích vyžadujících rychlou odezvu.
Čeština Chybí data o výkonu v češtině (MMMLU), což ztěžuje posouzení vhodnosti pro české uživatele.

Hodnocení podle kategorií

🧮
Věda & Matematika
92.6
Excelentní
💻
Programování
81.9
Výborný
🤖
Agenti & Nástroje
74.9
Dobrý
🧠
Obecná inteligence
63.1
Dobrý
Rychlost
10.3
Slabý

Expertní hodnocení

🎯
Killer Feature
Excelentní matematické schopnosti
Skryté riziko
Pomalá inference může omezit interaktivní použití
Doporučený scénář
Batch zpracování komplexních matematických úloh

Grok 4 je nejnovější model pro usuzování od xAI s kontextovým oknem o velikosti 256k. Podporuje paralelní volání nástrojů, strukturované výstupy a obrazové i textové vstupy. Upozorňujeme, že usuzování není zpřístupněno, usuzování nelze vypnout a úsilí vynaložené na usuzování nelze specifikovat. Cena se zvyšuje, jakmile celkový počet tokenů v daném požadavku překročí 128k tokenů. Více podrobností naleznete v dokumentaci xAI.

Unikátní charakteristiky

Grok 4 vyniká v matematice a vědě, což dokazují vysoké skóre v MATH-500 a GPQA Diamond. Podporuje multimodální vstupy (obrázky a text) a paralelní volání nástrojů, ale rychlost je slabá stránka.

Silné stránky

Matematika

Excelentní výkon v matematických úlohách, s 99.0% v MATH-500 a 94.3% v AIME 2025.

Věda

Vysoké skóre v GPQA Diamond (87.7%) naznačuje silné schopnosti v oblasti vědeckého uvažování.

Slabé stránky

Rychlost

Nízká rychlost zpracování, s TPS 41.2 a TTFT 6.181s, omezuje použitelnost v aplikacích vyžadujících rychlou odezvu.

Čeština

Chybí data o výkonu v češtině (MMMLU), což ztěžuje posouzení vhodnosti pro české uživatele.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5
Dražší (vstup 1.6x, výstup 1.6x)

Claude Opus může nabízet lepší kvalitu v některých oblastech, ale je dražší.

GOOGLE google/gemini-3-pro-preview
Levnější (vstup 1.5x, výstup 1.25x)

Gemini 3 Pro má větší kontextové okno, ale celkový výkon se může lišit.

OPENAI openai/gpt-5.1
Levnější (vstup 2.4x, výstup 1.5x)

GPT-5.1 nabízí velký kontext a může být levnější, ale postrádá multimodální vstupy.

X-AI x-ai/grok-4.1-fast
Mnohem levnější (vstup 15x, výstup 30x)

Grok-4.1-fast je výrazně levnější, ale pravděpodobně s nižší kvalitou výstupu.

Doporučení

Cílová skupina

  • Výzkumníci
  • Studenti
  • Inženýři

Vhodné pro

  • Matematické modelování
  • Vědecké simulace
  • Analýza dat

Nevhodné pro

  • Aplikace s nízkou latencí
  • Zpracování v reálném čase

Verdikt

Grok 4 je vhodný pro uživatele, kteří potřebují vysokou přesnost v matematických a vědeckých úlohách a nevadí jim pomalejší rychlost zpracování.