Google 17. 06. 2025

Google: Gemini 2.5 Flash

google/gemini-2.5-flash

Rozumování Matematika

48 /100

Průměrný

💰

Vstup

$0.3/1M

📤

Výstup

$2.5/1M

📏

Kontext

1048576

📝

Max výstup

65535

Vstup: file image text audio video → Výstup: text

💪 Silné stránky

Matematika Vynikající v matematických úlohách, dosahuje 93.2% v MATH-500 a 60.3% v AIME 2025.

Rychlost Vysoká rychlost zpracování s TPS 235.4 a nízkou latencí TTFT 0.359s.

⚠️ Slabé stránky

Logické myšlení Slabé výsledky v HLE (5.1%) a ifbench (39.0%) naznačují omezení v úlohách vyžadujících složité logické operace.

Čeština MMMLU skóre pro češtinu není k dispozici, což ztěžuje posouzení použitelnosti pro české uživatele.

Hodnocení podle kategorií

🧮

Věda & Matematika

66.0

Dobrý

💻

Programování

49.5

Průměrný

🤖

Agenti & Nástroje

14.9

Slabý

🧠

Obecná inteligence

52.5

Průměrný

⚡

Rychlost

82.0

Výborný

Expertní hodnocení

🎯

Killer Feature

Vynikající matematické schopnosti

⚡

Skryté riziko

Slabé logické myšlení a neznámá kvalita češtiny

✅

Doporučený scénář

Rychlé řešení matematických úloh a vědeckých výpočtů

Gemini 2.5 Flash je špičkový pracovní model od Googlu, speciálně navržený pro pokročilé usuzování, kódování, matematiku a vědecké úlohy. Zahrnuje vestavěné “myšlenkové” schopnosti, které mu umožňují poskytovat odpovědi s vyšší přesností a nuancovanějším zpracováním kontextu.

Navíc je Gemini 2.5 Flash konfigurovatelný prostřednictvím parametru “max tokens for reasoning” (maximální počet tokenů pro usuzování), jak je popsáno v dokumentaci (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).

Unikátní charakteristiky

Gemini 2.5 Flash je navržen pro pokročilé úlohy vyžadující rozumování, kódování, matematiku a vědecké výpočty. Model vyniká v matematických úlohách, což dokazuje vysoké skóre 93.2% v MATH-500. Díky konfigurovatelnému parametru ‘max tokens for reasoning’ umožňuje jemné doladění pro specifické use case.

Silné stránky

Matematika

Vynikající v matematických úlohách, dosahuje 93.2% v MATH-500 a 60.3% v AIME 2025.

Rychlost

Vysoká rychlost zpracování s TPS 235.4 a nízkou latencí TTFT 0.359s.

Slabé stránky

Logické myšlení

Slabé výsledky v HLE (5.1%) a ifbench (39.0%) naznačují omezení v úlohách vyžadujících složité logické operace.

Čeština

MMMLU skóre pro češtinu není k dispozici, což ztěžuje posouzení použitelnosti pro české uživatele.

Srovnání s konkurencí

ANTHROPIC anthropic/claude-sonnet-4.5

10x dražší vstup, 6x dražší výstup

Claude Sonnet 4.5 má větší kontext (1M tokenů), ale je výrazně dražší. Může být lepší pro úlohy vyžadující rozsáhlý kontext a vyšší kvalitu výstupu.

X-AI x-ai/grok-4-fast

Levnější vstup i výstup

Grok-4-fast je výrazně levnější a má větší kontext (2M tokenů), ale benchmarky naznačují nižší kvalitu v matematice a logice.

DEEPSEEK deepseek/deepseek-v3.2

Podobná cena vstupu, levnější výstup

Deepseek v3.2 nabízí podobnou cenu vstupu a levnější výstup, ale má menší kontext (163,840 tokenů). Může být vhodný pro úlohy s menším kontextem a důrazem na cenu.

MISTRALAI mistralai/ministral-14b-2512

Levnější vstup i výstup

Ministral-14b-2512 je levnější, ale benchmarky naznačují nižší kvalitu v matematice a logice. Kontext je menší (262,144 tokenů).

Doporučení

Cílová skupina

Výzkumníci
Data scientisti
Vývojáři

Vhodné pro

Matematické modelování
Vědecké simulace
Rychlé prototypování

Nevhodné pro

Složité logické úlohy
Aplikace vyžadující silnou češtinu

Verdikt

Gemini 2.5 Flash je vhodný pro uživatele, kteří potřebují rychlý a efektivní model pro matematické a vědecké úlohy, ale měli by se vyhnout úlohám vyžadujícím složité logické myšlení nebo silnou podporu češtiny.