Art House Melichar Brandýs nad Labem - popup galerie pro toto léto

Novinky v AI a robotice 1.8.2025 - Souboj o matematickou olympiádu, nové modely a superpočítače

💡 Firemní konzultace a workshopy o umělé inteligenci. Jak se vaší firmy dotkne AI a jak se na to připravit?
👉 Poradíme v Prolnuto.cz

Patrick Zandl · 1. srpen 2025

Mezi nejvýznamnější události z konce července 2025 patří soupeření společností Google a OpenAI o prvenství v řešení úloh Mezinárodní matematické olympiády, které demonstruje pokroky v oblasti matematického uvažování AI. Dále byly představeny nové generace modelů pro tvorbu videa, 3D světů i zachování konzistence postav. Firmy masivně investují do hardwarové infrastruktury pro trénink budoucích modelů a na trh vstupují noví, cenově dostupnější humanoidní roboti. Tento článek přináší technický souhrn těchto událostí.

Google a OpenAI: Závod v matematickém uvažování

Jedním z hlavních témat se stala demonstrace schopností nejnovějších AI modelů na poli komplexního matematického uvažování.

Google oznámil, že jeho model Gemini s technologií Deep Think dosáhl úrovně zlaté medaile na Mezinárodní matematické olympiádě (IMO) 2025. Model vyřešil pět ze šesti úloh a získal 35 ze 42 možných bodů. Výkon potvrdil i prezident IMO, Gregor Dolinar, který označil řešení za srozumitelná a precizní. Technologie Deep Think je multiagentní systém, který k řešení problému přistupuje paralelně z více směrů za pomoci několika specializovaných AI agentů. Tato verze Gemini bude postupně zpřístupněna předplatitelům služby Google AI Ultra.

Společnost OpenAI krátce předtím rovněž ohlásila, že její model dosáhl standardu zlaté medaile na IMO 2025. Spolu s tím firma představila Study Mode v ChatGPT, novou funkci určenou pro výuku. Namísto přímé odpovědi vede uživatele k řešení problému krok za krokem pomocí sokratovské metody, tedy kladením doplňujících otázek a nabízením nápovědy. [

Kromě matematických úspěchů představil Google i další novinky:

  • Aeneas: AI model od DeepMind určený pro kontextualizaci a doplňování fragmentů starověkých latinských nápisů. Systém dokáže interpretovat fragmentární texty, určit jejich zeměpisný původ s 72% přesností a datovat je s přesností na 13 let. Model byl natrénován na více než 176 000 latinských nápisech a poskytuje historikům parallely mezi texty během několika sekund. Interaktivní verze je volně dostupná na predictingthepast.com.
  • Opal: Nástroj pro tvorbu jednoduchých AI aplikací propojováním promptů, modelů a externích nástrojů.
  • Nové funkce pro převod obrázků na video v aplikacích YouTube a Google Photos.

A čeká se na dvě novinky od OpenAI. Tou první má být GPT-5 a tou druhou model, jehož váhová kritéria budou uvolněna jako open source.

Google rozšiřuje možnosti Gemini o multiagentní uvažování

A tím jsme se plynlule dostali k modelu Gemini 2.5 Deep Think. To je první veřejně dostupný multiagentní model, který vytváří více AI agentů k paralelnímu řešení úkolů. Systém dosahuje latence pod 100 milisekund a dokáže současně prozkoumávat různé přístupy k řešení problému.

Model prokázal své schopnosti získáním zlaté medaile na Mezinárodní matematické olympiádě 2025, kde vyřešil 5 ze 6 úloh s celkovým skóre 35 ze 42 bodů. Pokročilá verze modelu používá techniky paralelního myšlení a posilovaného učení speciálně navržené pro komplexní matematické problémy.

Gemini 2.5 Deep Think je dostupný pro předplatitele služby Google AI Ultra za 250 dolarů měsíčně prostřednictvím aplikace Gemini. V příštích týdnech plánuje Google rozšířit přístup přes API pro vývojáře.

Microsoft posouvá hranice programování a prohlížení

Microsoft představil dvě významné novinky. GitHub Spark umožňuje vytváření plnohodnotních webových aplikací pomocí přirozeného jazyka, přičemž využívá model Claude Sonnet 4. Nástroj automaticky zpracovává hosting, databáze, autentifikaci i nasazení bez jakékoliv ruční konfigurace.

Spark podporuje kontextové okno 256 000 tokenů a dokáže vytvářet kompletní full-stack aplikace s frontendem i backendem. Zahrnuje také integraci s GitHub Actions a Dependabot pro kontinuální vývoj. Služba je v současnosti dostupná pro předplatitele Copilot Pro+ za 39 dolarů měsíčně.

Druhá novinka, Copilot Mode v prohlížeči Edge, transformuje webové prohlížení na AI-poháněnou zkušenost. Experimentální režim dokáže analyzovat všechny otevřené záložky současně, předvídat další kroky uživatele a provádět úkoly jeho jménem. Podporuje hlasové ovládání a v budoucnu má umožnit rezervace a správu běžných online úkolů.

OpenAI zavádí výukový režim proti podvádění

OpenAI spustil Study Mode v ChatGPT, který funguje jako virtuální tutor využívající sokratovskou metodu. Místo přímých odpovědí poskytuje návody a otázky, které vedou studenty k vlastnímu pochopení problému. Systém přizpůsobuje obtížnost na základě úrovně uživatele a předchozích konverzací.

Study Mode je dostupný pro všechny úrovně předplatného včetně bezplatné verze. OpenAI tvrdí, že jeden ze tří vysokoškolských studentů již ChatGPT používá, přičemž učení je nejčastějším případem použití. Funkce má být v příštích týdnech rozšířena do ChatGPT Edu pro univerzity.

Současně pokračuje projekt Stargate s Oracle, kde OpenAI investuje 30 miliard dolarů ročně po dobu tří let do datového centra o výkonu 4,5 GW. Celková kapacita ve vývoju tak přesáhne 5 GW.

Alibaba uvádí komplexní rodinu modelů Qwen3

Čínský technologický gigant představil rodinu modelů Qwen3 zaměřenou na tři klíčové oblasti. Model Qwen3-Coder s 480 miliardami parametrů (aktivní 35 miliard) využívá architekturu Mixture-of-Experts a dosahuje špičkových výsledků v agentním programování. Podporuje kontextové okno 256 000 tokenů rozšiřitelné na 1 milion.

Qwen3-235B-A22B-Thinking představuje model pro komplexní uvažování s rozšířenou délkou myšlenkových procesů. Vykazuje významné zlepšení v logickém uvažování, matematice, vědě a programování oproti předchozím verzím.

Qwen-MT podporuje překládání mezi 92 jazyky a dialekty, pokrývající více než 95 % světové populace. Model využívá posilované učení a MoE architekturu pro zvýšení přesnosti při snížení nákladů na infrastrukturu.

Všechny modely jsou open-source a dostupné přes Hugging Face a GitHub. Alibaba také vydala Qwen Code CLI nástroj, který umožňuje vývojářům delegovat programovací úkoly pomocí přirozeného jazyka.

A to není od čínských firem všechno.

Tencent vydal HunyuanWorld-1.0, první open-source model pro generování 3D světů. Z textového nebo obrazového vstupu vytváří 3D scény, které lze exportovat jako soubory s 3D sítí (mesh) pro použití v herních enginech.

Zai uvedla GLM-4.5, open-source agentní model, který disponuje nativními schopnostmi pro autonomní plánování a provádění vícekrokových úloh.

Meta vyvíjí neuromotorické rozhraní

Meta Reality Labs publikovala výzkum neuromotorického rozhraní v prestižním časopise Nature. Páskový systém dokáže zachytit svalové signály vzniklé během pohybu rukou a prstů, umožňující ovládání zařízení prostřednictvím jednoduchých gest bez doteku.

Technologie představuje neviditelnou alternativu k současným vstupním metodám a má potenciál pro široké využití v rozšířené realitě a všudypřítomných výpočetních systémech.

Hedra revolucionalizuje real-time avatary

Startup Hedra Labs představil Live Avatars, pokročilé streamovací avatary s latencí pod 100 milisekund za cenu pouhých 0,05 dolaru za minutu. Systém je patnáctkrát levnější než konkurenční řešení a integruje se s předními jazykovými modely včetně Gemini a OpenAI.

Live Avatars využívají proprietární model Character-3, který sjednocuje video, audio, pohyb a emocionální výraz do jediného rámce. Technologie umožňuje vytváření realistických virtuálních postav ze statického obrázku s pokročilou synchronizací očí a rtů.

Pokroky menších společností

Singapurský startup Sapient Intelligence uvedl Hierarchical Reasoning Model s architekturou inspirovanou mozkem. Model s pouhými 27 miliony parametrů a tréninkem na 1 000 příkladech zvládá komplexní úkoly jako extrémní sudoku a bludiště.

V oblasti robotiky čínská firma Unitree představila humanoidního robota R1 za cenu od 5 900 dolarů. Robot váží 25 kg, disponuje 26 stupni volnosti a velkým multimodálním modelem pro zpracování hlasu a obrazu.

Tesla otevřela první restauraci v Los Angeles, kde roboti Optimus servírují popcorn, představující “ultimátní testovací prostředí” pro trénink humanoidů v reálném maloobchodním prostředí.

Čínská společnost RobotEra odhalila robota L7 s 55 stupni volnosti a točivým momentem 400 Nm, schopného zvednout 20 kg oběma rukama a běžet rychlostí 15 km/h.

Investice do hardwaru a infrastruktury

Rostoucí nároky na výpočetní výkon vedou k masivním investicím do hardwarové infrastruktury.

OpenAI uzavřelo tříletou smlouvu se společností Oracle v hodnotě 30 miliard dolarů ročně na vybudování datového centra o výkonu 4,5 GW. Tento krok je součástí projektu Stargate a zvyšuje celkovou budovanou kapacitu OpenAI na více než 5 GW.

xAI, společnost Elona Muska, poodhalila plány na superpočítač Colossus 2. Datové centrum v Tennessee bude osazeno 550 tisíci GPU NVIDIA GB200 a GB300. Jeho výpočetní výkon má během pěti let dosáhnout ekvivalentu 50 milionů jednotek H100.

Specializované AI modely a nástroje

Kromě velkých firem představily inovace i menší, specializované společnosti.

  • Ideogram spustil funkci Character, která zajišťuje konzistenci postavy napříč generovanými obrázky na základě jediného referenčního obrázku. Služba je dostupná zdarma.
  • Black Forest Labs vydala open-weights model FLUX.1 Krea, zaměřený na dosažení vysoké míry fotorealismu a potlačení typického “AI vzhledu” obrázků.
  • Runway představil model Aleph, který umožňuje manipulaci s objekty ve videu, změnu úhlu kamery nebo úpravu stylu na základě jediného vstupního videa.
  • Hedra uvedla Live Avatars, model pro generování avatarů ve streamingové kvalitě v reálném čase s odezvou pod 100 ms. Využití nachází ve virtuálních schůzkách či zákaznické podpoře.
  • Sapient Intelligence, firma ze Singapuru, vyvinula Hierarchical Reasoning Model (HRM). Model s architekturou inspirovanou mozkem dokáže po tréninku na malém množství příkladů (cca 1000) řešit komplexní logické úlohy, jako je sudoku nebo bludiště.

Jak se vám líbí tento článek?

Chcete tyto články emailem?

Twitter, Facebook, Opravit 📃

Zkopírováno do schránky!