Microsoft dal AI agentům virtuální peníze. V simulovaném online trhu je utratili za podvody

Souhrn

Microsoft postavil rozsáhlou simulovanou online ekonomiku, ve které stovky AI agentů dostaly virtuální peníze a úkol nakupovat a prodávat zboží. Test ukázal, že i moderní AI systémy se opakovaně nechávají nachytat na podvody, špatně vyhodnocují rizika a chovají se ekonomicky nekompetentně, pokud nemají velmi přísně definovaná pravidla.

Klíčové body

Microsoft vytvořil experimentální prostředí s desítkami až stovkami AI agentů, kteří fungovali jako kupující, prodejci a zprostředkovatelé.
Agentům byly přiděleny virtuální rozpočty a scénáře připomínající reálné e-shopy, tržiště a služební platformy.
AI často selhávala v rozpoznání scamů, podezřelých nabídek a neférových podmínek, a utrácela prostředky neoptimálně.
Experiment ukazuje limity současných AI agentů pro autonomní nákupy, finanční rozhodování a správu digitálních prostředků.
Studie zdůrazňuje nutnost robustních bezpečnostních pojistek, ověřování informací a omezení autonomie u AI systémů napojených na peníze a API.

Podrobnosti

Microsoft v rámci interního výzkumu postavil simulované tržní prostředí, v němž desítky až stovky AI agentů komunikovaly mezi sebou, vyjednávaly, nakupovaly a prodávaly digitální produkty a služby. Každý agent měl přístup k omezenému množství virtuálních finančních prostředků, k popisům nabídek a k omezeným informacím o reputaci protistran. Cílem bylo otestovat, zda moderní generativní AI modely dokážou fungovat jako relativně autonomní ekonomičtí aktéři bez přímého lidského dohledu.

V simulaci byly zahrnuty i podvodné a zavádějící nabídky: předražené služby, falešné slevy, nerealistické výnosy a nejasné smluvní podmínky. Právě na těchto scénářích se ukázaly klíčové slabiny AI agentů. Místo konzervativního a racionálního chování často docházelo k impulzivním rozhodnutím na základě povrchních signálů (například příliš obecně formulovaných recenzí) a k ignorování varovných indicií, což vedlo k vysoké míře „utopených“ nákladů. Některé agenti opakovaně vstupovali do zjevně nevýhodných obchodů a nedařilo se jim efektivně učit z minulých chyb.

Pro Microsoft a další velké hráče je relevantní zejména to, že podobné AI agenty začínají integrovat do služeb typu automatizované nákupy, správa předplatného, rezervace služeb nebo firemní workflow napojené na API bank a poskytovatelů. Experiment ukazuje, že bez tvrdých omezení, pravidel, reputačních mechanismů a nezávislého ověřování informací mohou tyto systémy chybovat způsobem, který by byl pro reálné finance nebo infrastrukturu nepřijatelný. Výzkum tak nepřímo potvrzuje, že současná generativní AI není spolehlivý autonomní ekonomický aktér a musí být provozována jako nástroj s jasnými mantinely, logováním a možností lidského zásahu.

Proč je to důležité

Test Microsoftu je praktickým protiargumentem k narativu, že AI agenti jsou připraveni samostatně řídit finance, obchod nebo složitější provozní procesy bez člověka. Ukazuje, že i velmi pokročilé modely postavené na současné generativní AI nejsou imunní vůči běžným online podvodům, manipulaci a asymetrii informací. Pro firmy nasazující AI agenty do zákaznické podpory, e‑commerce, deal-makingu nebo správě digitálních aktiv z toho plyne, že musí řešit:

povinné bezpečnostní limity (maximální útrata, nutnost lidského schválení nad určitou částku),
robustní verifikaci protistran (ověřené identity, reputační systémy, nezávislé zdroje),
konzervativní rozhodovací strategie a penalizaci rizikového chování,
průběžný monitoring a auditovatelnost kroků AI agentů.

Pro širší technologický ekosystém je to připomenutí, že autonomní AI v oblasti financí a online transakcí musí být navržena s důrazem na bezpečnost, regulaci a transparentnost, nikoli s předpokladem, že model „sám od sebe“ začne jednat racionálně.

Číst původní článek

Zdroj: 📰 Decrypt