Souhrn
Advokáti novinových společností, včetně Orlando Sentinel a New York Times, žádají soud v Manhattanu o sankce vůči OpenAI. Firma prý smazala miliony zápisů konverzací s ChatGPT, které měly sloužit jako důkaz o porušení autorských práv na novinové články. Tento krok proběhl navzdory příkazům dvou soudců k uchování těchto dat.
Klíčové body
- OpenAI nahradilo miliony požadovaných zápisů výstupů jinými konverzacemi, což naznačuje smazání původních logů.
- Zápisy měly obsahovat důkazy, že ChatGPT generuje obsah založený na chráněných novinových textech.
- Soudní příkazy vydali magistrátní soudkyně Ona Wang (listopad) a federální soudce (5. ledna).
- Spor vede Tribune Publishing, MediaNews Group a Authors Guild proti OpenAI za krádež a zkreslení obsahu.
- OpenAI odmítá odpovídat na otázky o smazaných datech.
Podrobnosti
Článek z New York Daily News popisuje eskalaci dlouhotrvajícího soudního sporu mezi OpenAI a skupinou mediálních domů. OpenAI, kalifornská firma specializující se na vývoj velkých jazykových modelů jako ChatGPT, čelí obviněním z toho, že trénovala své modely na milionech novinových článků bez souhlasu autorů. Tyto modely pak generují odpovědi pro uživatele, které často přímo kopírují nebo parafrázují původní reportáže, což vede k nepřesnostem a porušení autorských práv.
Klíčovým prvkem jsou output logs – záznamy konverzací mezi uživateli a ChatGPT. Tyto logy obsahují dotazy uživatelů a odpovědi modelu, které mohou prokázat, zda model čerpá z konkrétních zdrojů. V listopadu 2025 nařídila magistrátní soudkyně Ona Wang OpenAI předat 20 milionů těchto logů novinářům, přestože OpenAI se bránilo s odůvodněním vysokých nákladů a soukromí uživatelů. Tento příkaz potvrdil 5. ledna 2026 federální soudce v Manhattanu.
Podle dopisu advokáta Steva Liebermana z 5. ledna OpenAI nahradilo přes milion vybraných logů jinými konverzacemi. To naznačuje, že původní data byla smazána, přestože firma měla povinnost je uchovat. OpenAI standardně mažou starší logy kvůli úspoře úložiště a ochraně soukromí, ale soudní příkaz tuto praxi měl zastavit. Firma dosud neposkytla vysvětlení a ignoruje dotazy novinářů.
Spor zapojuje nejen Orlando Sentinel, ale i The New York Times, Tribune Publishing (vlastník mnoha lokálních novin) a MediaNews Group. K nim se přidali autoři jako členové Authors Guild. Noviny argumentují, že ChatGPT nejen krade obsah, ale i ho zkresluje, což škodí reputaci původních zdrojů. OpenAI se brání tvrzením, že trénink na veřejných datech spadá pod fair use – výjimku z autorských práv pro vzdělávací a transformační účely.
Proč je to důležité
Tento případ může zásadně ovlivnit budoucnost AI modelů. Pokud soud prokáže úmyslné ničení důkazů, OpenAI hrozí vysoké pokuty, příkaz k zastavení distribuce modelů nebo dokonce změna obchodního modelu. Pro mediální průmysl by vítězství znamenalo kompenzace a mechanismy k monitorování AI výstupů. Širší dopad se týká celého ekosystému AI: firmy jako Google (Gemini) nebo Anthropic (Claude) čelí podobným žalobám. Smazání logů zpochybňuje transparentnost tréninkových dat a složitou detekci plagiátorství v generovaném obsahu. Pro uživatele to znamená riziko nepřesných informací z AI bez možnosti ověření zdrojů, což oslabuje důvěru v nástroje jako ChatGPT. V kontextu evropského AI aktu a amerických soudů by předcedent mohl donutit k povinnému ukládání logů nebo watermarkingu výstupů AI.
Zdroj: 📰 Orlando Sentinel