Google představil Gemini 3 – nejvýkonnější AI model dosud, který překonává konkurenci v klíčových testech

Souhrn

Google představil svůj nejnovější model umělé inteligence Gemini 3, který podle vlastních údajů překonává konkurenční systémy v řadě standardizovaných testů. Model je nyní dostupný v aplikaci Gemini, ve vyhledávači Google Search a na vývojářských platformách jako AI Studio, Vertex AI a nové agenty řízené platformě Google Antigravity.

Klíčové body

Gemini 3 dosáhl nejvyššího skóre v historii LMArena Leaderboard (1 501 bodů).
Model vykazuje pokročilé schopnosti v multimodálním porozumění a generování kódu.
V testech Humanity’s Last Exam dosáhl 37,5 % a v GPQA Diamond 91,9 %, což odpovídá úrovni doktorského uvažování.
V matematickém benchmarku MathArena Apex zaznamenal nový rekord (23,4 %).
Faktografická přesnost modelu je nejvyšší mezi velkými jazykovými modely (72,1 % v SimpleQA Verified).

Podrobnosti

Gemini 3 je podle šéfa Google DeepMindu Demise Hassabise „nejlepším modelem na světě pro multimodální porozumění“ a zároveň jedním z nejschopnějších modelů pro generování kódu. Výrazně překonává svého předchůdce Gemini 2.5 ve všech hlavních AI benchmarkových testech. Model je navržen tak, aby poskytoval uživatelům stručnější, přesnější a méně stereotypní odpovědi – místo obecných frází má nabízet konkrétní poznatky. Díky integraci do Google Search, aplikace Gemini a vývojářských nástrojů jako Vertex AI (cloudová platforma pro strojové učení) a nové platformy Antigravity (určené pro vývoj agenty řízených aplikací) bude mít široké uplatnění jak pro běžné uživatele, tak pro odborníky. Antigravity umožňuje vytvářet autonomní agenty, kteří mohou plnit komplexní úkoly bez přímého zásahu člověka.

Proč je to důležité

Gemini 3 představuje významný posun v konkurenci mezi velkými AI modely, zejména vůči systémům od OpenAI (GPT-5), Anthropic (Claude) a Meta (Llama). Jeho výsledky v testech jako GPQA Diamond nebo MathArena Apex ukazují, že Google dosáhl pokroku nejen v obecném jazykovém porozumění, ale i v specializovaných oblastech jako matematika a faktografická přesnost. To má dopad na spolehlivost AI v kritických aplikacích – od vzdělávání a výzkumu po podnikové nástroje. Zároveň signalizuje, že Google zrychluje integraci pokročilé AI přímo do svých hlavních produktů, což může ovlivnit uživatelské chování i tržní pozice konkurenčních firem.

Číst původní článek

Zdroj: 📰 SiliconANGLE News