xAI 09. 07. 2025

xAI: Grok 4

x-ai/grok-4

Matematika Věda Programování

74 /100

Dobrý

💰

Vstup

$3.0/1M

📤

Výstup

$15.0/1M

📏

Kontext

256000

📝

Max výstup

N/A

Vstup: image text → Výstup: text

💪 Silné stránky

Matematika Excelentní výkon v matematických úlohách, s 99.0% v MATH-500 a 94.3% v AIME 2025.

Věda Vysoké skóre v GPQA Diamond (87.7%) naznačuje silné schopnosti v oblasti vědeckého uvažování.

⚠️ Slabé stránky

Rychlost Nízká rychlost zpracování, s TPS 41.2 a TTFT 6.181s, omezuje použitelnost v aplikacích vyžadujících rychlou odezvu.

Čeština Chybí data o výkonu v češtině (MMMLU), což ztěžuje posouzení vhodnosti pro české uživatele.

Hodnocení podle kategorií

🧮

Věda & Matematika

92.6

Excelentní

💻

Programování

81.9

Výborný

🤖

Agenti & Nástroje

74.9

Dobrý

🧠

Obecná inteligence

63.1

Dobrý

⚡

Rychlost

10.3

Slabý

Expertní hodnocení

🎯

Killer Feature

Excelentní matematické schopnosti

⚡

Skryté riziko

Pomalá inference může omezit interaktivní použití

✅

Doporučený scénář

Batch zpracování komplexních matematických úloh

Grok 4 je nejnovější model pro usuzování od xAI s kontextovým oknem o velikosti 256k. Podporuje paralelní volání nástrojů, strukturované výstupy a obrazové i textové vstupy. Upozorňujeme, že usuzování není zpřístupněno, usuzování nelze vypnout a úsilí vynaložené na usuzování nelze specifikovat. Cena se zvyšuje, jakmile celkový počet tokenů v daném požadavku překročí 128k tokenů. Více podrobností naleznete v dokumentaci xAI.

Unikátní charakteristiky

Grok 4 vyniká v matematice a vědě, což dokazují vysoké skóre v MATH-500 a GPQA Diamond. Podporuje multimodální vstupy (obrázky a text) a paralelní volání nástrojů, ale rychlost je slabá stránka.

Silné stránky

Matematika

Excelentní výkon v matematických úlohách, s 99.0% v MATH-500 a 94.3% v AIME 2025.

Věda

Vysoké skóre v GPQA Diamond (87.7%) naznačuje silné schopnosti v oblasti vědeckého uvažování.

Slabé stránky

Rychlost

Nízká rychlost zpracování, s TPS 41.2 a TTFT 6.181s, omezuje použitelnost v aplikacích vyžadujících rychlou odezvu.

Čeština

Chybí data o výkonu v češtině (MMMLU), což ztěžuje posouzení vhodnosti pro české uživatele.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5

Dražší (vstup 1.6x, výstup 1.6x)

Claude Opus může nabízet lepší kvalitu v některých oblastech, ale je dražší.

GOOGLE google/gemini-3-pro-preview

Levnější (vstup 1.5x, výstup 1.25x)

Gemini 3 Pro má větší kontextové okno, ale celkový výkon se může lišit.

OPENAI openai/gpt-5.1

Levnější (vstup 2.4x, výstup 1.5x)

GPT-5.1 nabízí velký kontext a může být levnější, ale postrádá multimodální vstupy.

X-AI x-ai/grok-4.1-fast

Mnohem levnější (vstup 15x, výstup 30x)

Grok-4.1-fast je výrazně levnější, ale pravděpodobně s nižší kvalitou výstupu.

Doporučení

Cílová skupina

Výzkumníci
Studenti
Inženýři

Vhodné pro

Matematické modelování
Vědecké simulace
Analýza dat

Nevhodné pro

Aplikace s nízkou latencí
Zpracování v reálném čase

Verdikt

Grok 4 je vhodný pro uživatele, kteří potřebují vysokou přesnost v matematických a vědeckých úlohách a nevadí jim pomalejší rychlost zpracování.