Google 17. 06. 2025

Google: Gemini 2.5 Pro

google/gemini-2.5-pro

Věda Matematika Programování

69 /100

Dobrý

💰

Vstup

$1.25/1M

📤

Výstup

$10.0/1M

📏

Kontext

1048576

📝

Max výstup

65536

Vstup: text image file audio video → Výstup: text

💪 Silné stránky

Věda a Matematika Vynikající výkon ve vědeckých a matematických úlohách, což dokazují benchmarky MATH-500 (96.7%) a GPQA Diamond (84.4%).

Programování Solidní schopnosti v programování, s výsledkem 80.1% v LiveCodeBench.

Kontext Velký kontext (1,048,576 tokenů) umožňuje zpracovávat rozsáhlé dokumenty a komplexní úlohy.

⚠️ Slabé stránky

Rychlost Nízká rychlost zpracování, s TPS 154.4 a TTFT 33.438s, což omezuje použití v aplikacích vyžadujících rychlou odezvu.

Čeština Nedostatek dat o výkonu v češtině (MMMLU), což ztěžuje posouzení vhodnosti pro české uživatele.

Hodnocení podle kategorií

🧮

Věda & Matematika

88.6

Výborný

💻

Programování

80.1

Výborný

🤖

Agenti & Nástroje

54.1

Průměrný

🧠

Obecná inteligence

61.8

Dobrý

⚡

Rychlost

38.6

Slabý

Expertní hodnocení

🎯

Killer Feature

Vynikající matematické schopnosti

⚡

Skryté riziko

Pomalá inference může omezit interaktivní použití

✅

Doporučený scénář

Řešení komplexních matematických problémů a vědeckých simulací

Gemini 2.5 Pro je nejmodernější AI model od Googlu, navržený pro pokročilé usuzování, kódování, matematiku a vědecké úlohy. Využívá “myšlenkové” schopnosti, které mu umožňují odůvodňovat odpovědi se zvýšenou přesností a nuancovanou manipulací s kontextem. Gemini 2.5 Pro dosahuje špičkového výkonu v několika benchmarkách, včetně prvního místa v žebříčku LMArena, což odráží vynikající sladění s preferencemi lidí a schopnosti řešit složité problémy.

Unikátní charakteristiky

Gemini 2.5 Pro vyniká ve vědeckých a matematických úlohách, což dokazuje vysoké skóre v benchmarkách MATH-500 (96.7%) a GPQA Diamond (84.4%). Model se také dobře umisťuje v programování (LiveCodeBench 80.1%). Jeho velký kontext (1,048,576 tokenů) umožňuje zpracovávat komplexní úlohy.

Silné stránky

Věda a Matematika

Vynikající výkon ve vědeckých a matematických úlohách, což dokazují benchmarky MATH-500 (96.7%) a GPQA Diamond (84.4%).

Programování

Solidní schopnosti v programování, s výsledkem 80.1% v LiveCodeBench.

Kontext

Velký kontext (1,048,576 tokenů) umožňuje zpracovávat rozsáhlé dokumenty a komplexní úlohy.

Slabé stránky

Rychlost

Nízká rychlost zpracování, s TPS 154.4 a TTFT 33.438s, což omezuje použití v aplikacích vyžadujících rychlou odezvu.

Čeština

Nedostatek dat o výkonu v češtině (MMMLU), což ztěžuje posouzení vhodnosti pro české uživatele.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-opus-4.5

4x dražší vstup, 2.5x dražší výstup

Claude Opus je dražší, ale může nabídnout lepší výkon v některých oblastech. Nemáme data pro přímé srovnání.

OPENAI openai/gpt-5.1

Stejná cena

GPT-5.1 má menší kontext (400,000 tokenů). Nemáme data pro přímé srovnání výkonu.

X-AI x-ai/grok-4.1-fast

6x levnější vstup, 20x levnější výstup

Grok je výrazně levnější a má větší kontext (2,000,000 tokenů), ale pravděpodobně nižší výkon ve vědeckých a matematických úlohách.

MISTRALAI mistralai/ministral-14b-2512

6x levnější vstup, 50x levnější výstup

Mistral je mnohem levnější, ale má menší kontext (262,144 tokenů) a pravděpodobně nižší výkon ve vědeckých a matematických úlohách.

Doporučení

Cílová skupina

Výzkumníci
Data Scientists
Softwaroví inženýři

Vhodné pro

Analýza dat
Vědecké modelování
Generování kódu

Nevhodné pro

Aplikace s nízkou latencí
Úlohy vyžadující plynulou konverzaci
Aplikace v češtině

Verdikt

Gemini 2.5 Pro je vhodný pro uživatele, kteří potřebují vysoký výkon v matematice, vědě a programování a nevadí jim pomalejší odezva. Pro aplikace v češtině je třeba ověřit jeho schopnosti.