XAI Grok 4.1 a Grok 4.2 by mohly předstihnout Google Gemini 3 Pro v žebříčku AI modelů

Souhrn

Model Grok 4.1 od společnosti XAI se výrazně zlepšuje a podle žebříčku lmarena pro textové schopnosti LLM (large language models) se blíží výkonu Google Gemini 3 Pro. Rozdíl v ELO skóre mezi oběma modely klesl na pouhých 14 bodů (1495 u Gemini vs. 1481 u Grok 4.1). XAI navíc připravuje významnou aktualizaci Grok 4.2, která by mohla být uvedena už v prosinci 2025.

Klíčové body

Grok 4.1 dostává průběžné aktualizace a víc reinforcement learning tréninku.
Google Gemini 3 Pro ztrácí body v žebříčku lmarena – klesl z ~1505 na 1495.
Rozdíl mezi modely je nyní pouze 1 % v ELO škále.
Grok 4.2, označovaný jako „major improvement“, by mohl být připraven do Vánoc 2025.
Nové verze Grok budou věnovat více výpočetního času analýze uživatelských dotazů pro lepší přesnost.

Podrobnosti

Společnost XAI, založená Elonem Muskiem, systematicky vylepšuje svůj jazykový model Grok 4.1. Podle dat z platformy lmarena, která hodnotí výkon LLM v reálném čase na základě uživatelských interakcí, se Grok 4.1 drží stabilně na ELO skóre 1481, zatímco Google Gemini 3 Pro pomalu klesá – z původních 1505–1510 bodů na aktuálních 1495. Tento trend naznačuje, že XAI se blíží konkurenční paritě s jedním z nejlepších komerčních modelů na trhu.

Elon Musk uvedl, že Grok 4.1 nyní využívá více reinforcement learningu a v budoucnu bude model déle „přemýšlet“ nad uživatelskými dotazy, což má zvýšit přesnost odpovědí. Současně se připravuje Grok 4.2, který by měl přinést významné zlepšení – Musk ho označil za „major upgrade“ s cílem uvedení do konce roku 2025. Tento vývoj ukazuje, že XAI se snaží nejen dohnat, ale i předstihnout konkurenci v oblasti pokročilých jazykových modelů.

Proč je to důležité

Tento posun má význam pro celý ekosystém umělé inteligence. Pokud Grok 4.2 skutečně dosáhne výkonu nad Google Gemini 3 Pro, posílí to postavení XAI jako vážného hráče v oblasti LLM – vedle OpenAI, Anthropic a Google. Zároveň to ukazuje, že trh s AI modelem je dynamický a konkurenční tlak urychluje inovace. Pro uživatele to může znamenat lepší přístup k přesnějším a rychlejším AI nástrojům, zejména v rámci platformy X (dříve Twitter), kde je Grok integrován. Pro průmysl je důležité, že i novější hráči jako XAI dokážou konkurovat technologickým gigantům díky agilnímu vývoji a cílenému využití výpočetních zdrojů.

Číst původní článek

Zdroj: 📰 Next Big Future