📰 Next Big Future

XAI Grok 4.1 a Grok 4.2 by mohly předstihnout Google Gemini 3 Pro v žebříčku AI modelů

XAI Grok 4.1 a Grok 4.2 by mohly předstihnout Google Gemini 3 Pro v žebříčku AI modelů

Souhrn

Model Grok 4.1 od společnosti XAI se výrazně zlepšuje a podle žebříčku lmarena pro textové schopnosti LLM (large language models) se blíží výkonu Google Gemini 3 Pro. Rozdíl v ELO skóre mezi oběma modely klesl na pouhých 14 bodů (1495 u Gemini vs. 1481 u Grok 4.1). XAI navíc připravuje významnou aktualizaci Grok 4.2, která by mohla být uvedena už v prosinci 2025.

Klíčové body

  • Grok 4.1 dostává průběžné aktualizace a víc reinforcement learning tréninku.
  • Google Gemini 3 Pro ztrácí body v žebříčku lmarena – klesl z ~1505 na 1495.
  • Rozdíl mezi modely je nyní pouze 1 % v ELO škále.
  • Grok 4.2, označovaný jako „major improvement“, by mohl být připraven do Vánoc 2025.
  • Nové verze Grok budou věnovat více výpočetního času analýze uživatelských dotazů pro lepší přesnost.

Podrobnosti

Společnost XAI, založená Elonem Muskiem, systematicky vylepšuje svůj jazykový model Grok 4.1. Podle dat z platformy lmarena, která hodnotí výkon LLM v reálném čase na základě uživatelských interakcí, se Grok 4.1 drží stabilně na ELO skóre 1481, zatímco Google Gemini 3 Pro pomalu klesá – z původních 1505–1510 bodů na aktuálních 1495. Tento trend naznačuje, že XAI se blíží konkurenční paritě s jedním z nejlepších komerčních modelů na trhu.

Elon Musk uvedl, že Grok 4.1 nyní využívá více reinforcement learningu a v budoucnu bude model déle „přemýšlet“ nad uživatelskými dotazy, což má zvýšit přesnost odpovědí. Současně se připravuje Grok 4.2, který by měl přinést významné zlepšení – Musk ho označil za „major upgrade“ s cílem uvedení do konce roku 2025. Tento vývoj ukazuje, že XAI se snaží nejen dohnat, ale i předstihnout konkurenci v oblasti pokročilých jazykových modelů.

Proč je to důležité

Tento posun má význam pro celý ekosystém umělé inteligence. Pokud Grok 4.2 skutečně dosáhne výkonu nad Google Gemini 3 Pro, posílí to postavení XAI jako vážného hráče v oblasti LLM – vedle OpenAI, Anthropic a Google. Zároveň to ukazuje, že trh s AI modelem je dynamický a konkurenční tlak urychluje inovace. Pro uživatele to může znamenat lepší přístup k přesnějším a rychlejším AI nástrojům, zejména v rámci platformy X (dříve Twitter), kde je Grok integrován. Pro průmysl je důležité, že i novější hráči jako XAI dokážou konkurovat technologickým gigantům díky agilnímu vývoji a cílenému využití výpočetních zdrojů.


Číst původní článek

Zdroj: 📰 Next Big Future