Proč umělá inteligence nezměnila náš život v roce 2025

Souhrn

Rok 2025 byl označen jako éra AI agentů, kteří měli vstoupit do pracovního procesu a radikálně změnit produktivitu firem. Představy Sama Altmana z OpenAI a Kevina Weila na fóru v Davosu slibovaly systémy schopné samostatně vyplňovat formuláře, rezervovat restaurace či hotely. Ve skutečnosti se tyto autonomní agenti ukázali jako nedostatečně spolehlivé a nedosáhli slibovaného průlomu.

Klíčové body

Sam Altman z OpenAI předpověděl v roce 2024, že AI agenti se v roce 2025 stanou součástí pracovní síly a výrazně ovlivní firemní výkon.
Kevin Weil, šéf pro produkty OpenAI, na Světovém ekonomickém fóru v Davosu slíbil přechod od chatových robotů k systémům působícím v reálném světě, včetně rezervací a vyplňování formulářů.
AI agenti se liší od chatových robotů tím, že autonomně navigují v digitálním prostředí, používají prohlížeče a plní vícekrokové úkoly.
Marc Benioff ze Salesforce mluvil o „digitální revoluci práce“ v hodnotě bilionů dolarů, přičemž tvrdí, že polovina práce v jeho firmě je již řešena AI.
Do konce 2024 byly AI nástroje úspěšné v programování, což vedlo k očekáváním širšího nasazení.

Podrobnosti

Článek z The New Yorker analyzuje, proč rok 2025 nesplnil sliby technologického průmyslu ohledně AI agentů. Před rokem Sam Altman, generální ředitel OpenAI – společnosti vyvíjející velké jazykové modely jako GPT série – prohlásil, že AI agenti se stanou součástí pracovní síly a změní firemní produktivitu. Krátce poté Kevin Weil na konferenci v Davosu rozšířil vizi: ChatGPT, původně pouze inteligentní chatový robot odpovídající na textové příkazy jako odpovědi na otázky nebo psaní e-mailů, měl přejít k akcím v reálném světě. Konkrétně zmínil vyplňování online formulářů a rezervace v restauracích, s ujištěním, že to „žádný problém nebude“.

AI agent představuje pokročilejší systém než chatbot: autonomně prochází webovými stránkami, interaguje s aplikacemi a řeší složité úkoly vyžadující více kroků. Například rezervace hotelu zahrnuje výběr dat, filtrování podle preferencí, čtení recenzí, porovnávání cen na různých platformách a dokončení platby. Takový agent by mohl tyto procesy plně automatizovat, což by ušetřilo čas zaměstnancům a potenciálně je nahradilo. OpenAI má korporátní partnerství s Condé Nast, vydavatelem The New Yorker, což dodává kontextu.

Přesto realita roku 2025 ukázala limity. Ačkoli AI excelovaly v programování – například generování kódu nebo debugging – přechod k reálnosvětovým agentům selhal kvůli problémům se spolehlivostí. Agenti trpí halucinacemi, kde vymýšlejí neexistující informace, špatným plánováním sekvencí akcí nebo chybami v integraci s externími API a prohlížeči. Demo verze, jako ty od OpenAI nebo Anthropic, ukazovaly slibné ukázky, ale v praxi selhaly při škálování na složitější scénáře. Salesforce pod Benioffem integroval AI do CRM systémů pro automatizaci rutinních úkolů, ale plnoautonomní agenti zůstali v prototypové fázi. Tento overhype odráží širší trend v AI: rychlý pokrok v benchmarkách, ale pomalé nasazení v produkci kvůli bezpečnostním a etickým rizikům.

Proč je to důležité

Tato neuskutečněná vize nastavuje realistická očekávání pro AI ekosystém. Zatímco chatboti jako ChatGPT zlepšují produktivitu o 20–30 % u kreativních úkolů, autonomní agenti by mohli přinést násobek, ale vyžadují pokroky v reasoningu, tool-using a error-handling. Pro průmysl to znamená opatrnost při investicích – trh s AI agenty byl v roce 2025 hodnocen na stovky miliard, ale bez průlomu hrozí korekce. Pro uživatele to potvrzuje, že AI zatím doplňuje práci, ne ji nahrazuje. V širším kontextu to varuje před cykly nadšení v AI, podobně jako u self-driving aut Tesly, kde sliby opakovaně zaostávají za realitou. Rok 2025 tak zdůrazňuje potřebu robustních evaluací před komerčním nasazením.

Číst původní článek

Zdroj: 📰 The New Yorker