Jak funguje autorské právo v oblasti umělé inteligence – a proč se soudy neshodují
Společnosti zabývající se umělou inteligencí trénují modely na miliardách děl chráněných autorským právem, což vyvolává soudní spory a legislativu po celém světě. Zde je popsáno, jak principy spravedlivého užití (fair use), pravidla pro vytěžování textových dat (text-data mining) a průlomová soudní rozhodnutí formují právní bitvu o tréninková data pro umělou inteligenci.
Otázka za miliardy dolarů
Každý významný generativní model umělé inteligence – od ChatGPT po Claude až po Midjourney – byl trénován na obrovském množství textu, obrázků a kódu staženého z internetu. Velká část tohoto materiálu je chráněna autorským právem. Zda společnosti zabývající se umělou inteligencí potřebují povolení k jeho použití, je nyní nejdůležitější otázkou duševního vlastnictví desetiletí, s více než 50 probíhajícími soudními spory jen u soudů v USA a regulátory na třech kontinentech, kteří píší nová pravidla.
Jak se princip spravedlivého užití (Fair Use) vztahuje na trénink umělé inteligence
Ve Spojených státech se právní debata soustředí na spravedlivé užití (fair use), doktrínu, která umožňuje omezené použití materiálu chráněného autorským právem bez souhlasu držitele práv. Soudy zvažují čtyři faktory při rozhodování, zda se jedná o spravedlivé užití:
- Účel a povaha – Je nové použití „transformační“, přidává něco jiného, než že by nahrazovalo originál? Soudy zjistily, že trénování univerzálního modelu umělé inteligence na velkém, různorodém souboru dat je vysoce transformační, protože model se učí vzory, spíše než aby reprodukoval konkrétní díla.
- Povaha původního díla – Vysoce kreativní nebo nepublikovaná díla požívají silnější ochrany, což ztěžuje uplatnění spravedlivého užití.
- Použité množství – Trénink umělé inteligence obvykle zahrnuje celá díla, což hraje proti spravedlivému užití, ačkoli soudy akceptovaly, že kopírování celých děl může být nezbytné pro transformační účel.
- Dopad na trh – Pokud výstup umělé inteligence konkuruje původnímu dílu nebo jej nahrazuje, tento faktor hraje proti spravedlivému užití. Americký úřad pro autorská práva poznamenal, že tam, kde existují licenční trhy, je nelicencovaný trénink obtížnější ospravedlnit.
Žádný jednotlivý faktor není rozhodující. Každý případ závisí na tom, jak se tyto čtyři faktory vzájemně ovlivňují, což je důvod, proč soudci dospěli k protichůdným závěrům u téměř identických skutečností.
Dosavadní průlomová rozhodnutí
Tři klíčová rozhodnutí v USA začala načrtávat hranice. V případu Bartz v. Anthropic federální soudce rozhodl, že trénování modelu Claude na knihách bylo spravedlivé užití, protože bylo „kvintesenciálně transformační“ – ale rozhodl, že stahování pirátských kopií těchto knih nebylo. V případu Kadrey v. Meta jiný soudce shledal spravedlivé užití, i když Meta získala tréninkové knihy z pirátských „stínových knihoven“. A v případu Thomson Reuters v. Ross Intelligence soud zcela zamítl obhajobu spravedlivého užití a rozhodl, že použití obsahu chráněného autorským právem konkurentem k trénování vlastní umělé inteligence překročilo hranici.
Nejvýznamnější případ – The New York Times v. OpenAI – je stále ve fázi dokazování. Soudce nařídil společnosti OpenAI předat 20 milionů záznamů interakcí ChatGPT a rozhodnutí o spravedlivém užití se neočekává dříve než v polovině roku 2026.
Jak Evropa volí jinou cestu
Evropská unie se spravedlivému užití zcela vyhýbá. Podle směrnice o jednotném digitálním trhu z roku 2019 umožňuje výjimka pro vytěžování textových a datových dat (TDM) komukoli stahovat legálně přístupný obsah – pokud se držitel práv výslovně neodhlásí pomocí strojově čitelných protokolů, jako je robots.txt. Zákon EU o umělé inteligenci přidává transparentnost: poskytovatelé univerzální umělé inteligence musí zveřejnit „dostatečně podrobný souhrn“ svých tréninkových dat, včetně obsahu chráněného autorským právem.
Spojené království mezitím zvažovalo širokou výjimku TDM s mechanismem odhlášení, ale od tohoto plánu upustilo v březnu 2026 po silném odporu ze strany kreativního průmyslu. Vláda uvedla, že nebude přijímat zákony, dokud nenajde řešení, které uspokojí jak vývojáře umělé inteligence, tak držitele práv.
Proč na tom záleží
Výsledek určí, kdo bude profitovat z umělé inteligence a kdo zůstane pozadu. Pokud soudy široce podpoří spravedlivé užití, společnosti zabývající se umělou inteligencí mohou pokračovat v tréninku na otevřeném internetu s nízkými náklady. Pokud ne, bude průmysl potřebovat licenční dohody – potenciálně v hodnotě miliard – s vydavateli, umělci a dalšími tvůrci. Americký úřad pro autorská práva vyzval Kongres, aby vytvořil „škálovatelné mechanismy“ pro vyjasnění práv, ale legislativa zůstává v patové situaci.
Pro tvůrce jsou sázky existenční. Spisovatelé, vizuální umělci a hudebníci tvrdí, že nekompenzovaný trénink znehodnocuje jejich práci. Společnosti zabývající se umělou inteligencí namítají, že omezení tréninkových dat by soustředilo moc mezi několik firem, které jsou dostatečně bohaté na to, aby vyjednaly licence, což by zpomalilo inovace pro všechny.
S významnými rozhodnutími očekávanými ještě letos a regulačními rámci, které jsou stále v pohybu na obou stranách Atlantiku, se právní architektura upravující umělou inteligenci a autorské právo buduje v reálném čase – jeden případ, jeden zákon a jeden protokol pro odhlášení po druhém.