Minulý týden se opět děly zajímavé věci v umělé inteligenci. Společnosti představily pokročilé autonomní agenty, modely pro generování obrázků dosahující kvality 4K rozlišení a poprvé v historii byla umělá inteligence jmenována do vládní funkce. Nejvýznamnější novinky zahrnují Replit Agent 3 s možností samostatného vývoje aplikací, model Seedream 4.0 od ByteDance pro rychlé vytváření obrázků a historické jmenování AI ministra v Albánii.
Replit Agent 3 - autonomní vývoj až 200 minut
Společnost Replit, která provozuje cloudové vývojové prostředí, spustila třetí generaci svého AI agenta s výrazně rozšířenými možnostmi. Agent 3 dokáže pracovat autonomně až 200 minut bez zásahu uživatele, během nichž vytváří, testuje a opravuje aplikace. Nejdůležitější změnou je schopnost vytvářet další agenty a automatizace, což ho posouvá od pomocného nástroje k plnohodnotnému vývojářskému spolupracovníkovi.
Systém dokáže řídit celý vývojový cyklus - od analýzy požadavků přes implementaci až po testování a nasazení. Replit se tak přibližuje vizi plně automatizovaného vývoje softwaru, kde AI agent zvládne komplexní projekty s minimální supervizí člověka.
ByteDance Seedream 4.0 - generování 4K obrázků za sekundy
Čínská společnost ByteDance, známá především aplikací TikTok, představila čtvrtou generaci svého modelu Seedream pro generování obrázků. Model sjednocuje generování a úpravy obrázků v jediné architektuře s výstupem v rozlišení 4K. Podle testů překonává Google Imagen na standardních měřítkách výkonu a dokáže vytvořit obrázek v rozlišení 2K za pouhých 1,8 sekundy.
Seedream 4.0 se umístil na první příčku v žebříčku Artificial Analysis pro generování obrázků s ELO skóre 1,222. V kategorii úprav obrázků obsadil rovněž první místo s ELO skóre 1,285. Rychlost generování představuje významný pokrok oproti konkurenčním řešením, která obvykle vyžadují několik sekund až minut pro vytvoření kvalitního výstupu.
K2-Think z UAE - open-source rival GPT-5
Spojené arabské emiráty vydaly open-source model K2-Think s 32 miliardami parametrů, který podle testů dosahuje výkonu srovnatelného s GPT-5, ale při zlomku velikosti. Systém excempe ve výpočtech a matematických úlohách, přičemž na specializovaném hardwaru dokáže generovat 2 000 tokenů za sekundu.
Model K2-Think představuje významný krok v demokratizaci pokročilých AI modelů. Open-source přístup umožňuje výzkumníkům a vývojářům experimentovat s pokročilými schopnostmi uvažování bez závislosti na komerčních řešeních velkých technologických firem.
ElevenLabs Voice Remixing - úprava hlasů v alfa verzi
Startup ElevenLabs, specializující se na syntézu řeči, spustil alfa verzi funkce Voice Remixing. Uživatelé mohou upravovat charakteristiky AI hlasů včetně pohlaví, věku a přízvuku prostřednictvím přirozeného jazyka. Funkce otevírá nové možnosti pro kreativní vyprávění a návrh konverzačních agentů.
Technologie umožňuje kompletní přizpůsobení hlasu bez nutnosti nahrávání nových vzorků. Stačí popsat požadované změny - například “udělej z tohoto hlasu starší ženu s britským přízvukem” - a systém automaticky upraví všechny potřebné parametry.
Baidu ERNIE X1.1 - vylepšený čínský model
Čínská společnost Baidu představila aktualizovanou verzi svého modelu ERNIE X1.1 s o 34,8 % vylepšenou faktickou přesností a rozšířenými schopnostmi agentů. Model překonává DeepSeek R1 a dosahuje srovnatelného výkonu s GPT-5 a Gemini 2.5 Pro v benchmarkových testech.
ERNIE X1.1 posíluje pozici Baidu na čínském trhu AI a představuje vážnou konkurenci pro západní modely. Vylepšená faktická přesnost je klíčová pro praktické nasazení v obchodních aplikacích, kde jsou chyby nákladné.
Albánie jmenovala prvního AI ministra
Albánie učinila historický krok jmenováním Dielly, prvního AI ministra na světě. Virtuální asistent bude dohlížet na veřejné zakázky a má za cíl eliminovat korupci. Systém převezme všechna rozhodnutí o zadávání veřejných zakázek s cílem zajistit “100% korupci prosté” vládní výdaje.
Toto experimentální nasazení AI v přímé vládní funkci sleduje celý svět. Pokud se ukáže úspěšné, může inspirovat další země k podobným krokům. Kritici však upozorňují na rizika automatizovaného rozhodování v oblasti veřejné správy.
Anthropic rozšířil Claude o vytváření souborů
Společnost Anthropic přidala do svého modelu Claude možnost přímo vytvářet a upravovat soubory Excel, PowerPoint, Word a PDF během konverzace. Funkce mění Claude z poradce na aktivního spolupracovníka, který zvládá technickou implementaci na pozadí.
Uživatelé tak mohou požádat o vytvoření prezentace nebo analýzy a Claude automaticky vygeneruje odpovídající soubor. Tato integrace výrazně zjednodušuje pracovní postupy a eliminuje nutnost přenášet informace mezi různými aplikacemi.
Apple konečně představil překlad v reálném čase
Apple uvedl funkci překladu v reálném čase pro AirPods a iOS 26. Technologie umožňuje konverzace napříč jazyky s živým hlasovým překladem, který funguje kompletně offline na zařízení. Funkce konkuruje Google Translate a podobným službám, ale s důrazem na soukromí díky zpracování na zařízení.
Implementace v AirPods otevírá nové možnosti pro cestování a mezinárodní obchodní jednání. Uživatelé mohou vést plynulé konverzace bez nutnosti držet telefon nebo spoléhat na internetové připojení.
Týden potvrdil, že vývoj umělé inteligence zrychluje napříč všemi oblastmi - od autonomních agentů přes multimodální modely až po přímou integraci do vládních struktur. Technologie se posunuly od experimentálních nástrojů k praktickým řešením měnícím způsob práce i život.