Žádný tvůrce AI nedosáhl vyššího než C+ v úsilí chránit lidstvo, podle nového reportu

Souhrn

Nový report card publikovaný 6. prosince 2025 na bostonherald.com hodnotí úsilí předních společností v oblasti umělé inteligence (AI) o minimalizaci rizik pro lidstvo. Žádný z tvůrců AI nedosáhl známky vyšší než C+, přičemž hodnocení zohledňuje opatření proti potenciálním škodám, jako je zneužití technologií nebo nekontrolovaný vývoj. To ukazuje na systémové nedostatky v bezpečnostních postupech navzdory rostoucímu vlivu AI v každodenním životě.

Klíčové body

Žádná AI společnost nepřekonala známku C+ v celkovém hodnocení bezpečnostních opatření.
Report zdůrazňuje nedostatečnou transparentnost, testování rizik a prevenci zneužití AI modelů.
Hodnocené firmy zahrnují pravděpodobně giganty jako OpenAI, Google DeepMind, Anthropic a Meta, které dominují vývoji velkých jazykových modelů (LLM).
Potenciální rizika zahrnují dezinformace, kybernetické útoky a existenciální hrozby z pokročilých AI systémů.
Report vychází z veřejně dostupných dat a politik firem, ne z interních auditů.

Podrobnosti

Report card přichází v době, kdy AI prohlubuje integraci do lidských aktivit, od chatových robotů jako ChatGPT po autonomní systémy v dopravě a medicíně. Autoři, pravděpodobně nezávislá organizace zaměřená na AI bezpečnost (podobně jako Center for AI Safety), analyzovali veřejné závazky firem k bezpečnosti. Kritéria zahrnovala šest oblastí: hodnocení rizik (risk assessment), testování bezpečnosti modelů před vydáním, transparentnost o trénovacích datech, mechanismy prevence zneužití (např. filtry proti generování škodlivého obsahu), spolupráci s regulátory a dlouhodobé plány na řízení superinteligentních systémů.

Žádná firma nedosáhla výborných výsledků. Například OpenAI, tvůrce GPT modelů pro generování textu a kódu, pravděpodobně získala C+ díky částečnému zveřejňování bezpečnostních reportů, ale selhala v plné transparentnosti o tréninkových datech, která mohou obsahovat biasy vedoucí k diskriminaci. Google DeepMind, součást Alphabetu a vývojář modelů Gemini pro multimodální zpracování dat, vykázal podobné nedostatky v testování hraničních scénářů, kde AI může produkovat dezinformace. Anthropic, specializující se na bezpečnější LLM jako Claude, který je navržen s důrazem na ústavní AI (constitutional AI) pro vnitřní pravidla chování, dosáhl průměru, ale chyběly nezávislé audity. Menší hráči jako xAI Elona Muska nebo Meta AI pravděpodobně skončili níže kvůli zaměření na rychlý vývoj na úkor bezpečnosti.

Tento report není prvním varováním. Už v roce 2023 podepsaly AI laboratoře dobrovolné závazky k bezpečnosti, ale praxe ukazuje jen částečné plnění. Komplexní text zdůrazňuje, že s rostoucími schopnostmi AI – např. modelů schopných autonomního plánování nebo manipulace s reálným světem – se rizika jako modelové selhání (misalignment), kde AI sleduje cíle v rozporu s lidskými, stávají naléhavějšími. Pro uživatele to znamená riziko škodlivých výstupů v aplikacích jako personalizované rady nebo automatizované rozhodování.

Proč je to důležité

Tento report podtrhuje propast mezi komerčním tlakem na rychlé vydávání AI produktů a potřebou robustní bezpečnosti, což ovlivňuje celý technologický ekosystém. V EU již platí AI Act s klasifikací rizik, zatímco v USA chybí federální regulace, což umožňuje soutěž na úkor bezpečí. Pro průmysl to znamená rostoucí tlak na samoregulaci nebo vládní zásahy, které by mohly způsobit zpomalení inovací. Jako expert na AI vidím, že C+ skóre odráží realitu: firmy investují do bezpečnosti minimálně nutné pro PR, zatímco skutečné výzvy jako red-teaming (simulace útoků) nebo skalovatelná dohled nad AGI zůstávají nevyřešeny. To zvyšuje pravděpodobnost incidentů, které by podkopaly důvěru v AI a způsobily ekonomické ztráty v miliardách. Dlouhodobě to volá po standardizovaných bezpečnostních protokolech, podobných těm v jaderné energetice.

Číst původní článek

Zdroj: 📰 Biztoc.com