Ako funguje autorské právo v oblasti umelej inteligencie – a prečo sa súdy nezhodujú
Spoločnosti zaoberajúce sa umelou inteligenciou trénujú modely na miliardách diel chránených autorským právom, čo vyvoláva súdne spory a legislatívu na celom svete. Tu je návod, ako princíp spravodlivého použitia (fair use), pravidlá pre dolovanie textových dát (text-data mining) a prelomové súdne rozhodnutia formujú právny boj o tréningové dáta pre AI.
Otázka za miliardu dolárov
Každý významný generatívny model AI – od ChatGPT po Claude až po Midjourney – bol trénovaný na obrovskom množstve textu, obrázkov a kódu získaného z internetu. Veľká časť tohto materiálu je chránená autorským právom. Či spoločnosti zaoberajúce sa AI potrebujú povolenie na jeho použitie, je teraz najdôležitejšou otázkou duševného vlastníctva desaťročia, pričom len v amerických súdoch prebieha viac ako 50 súdnych sporov a regulačné orgány na troch kontinentoch píšu nové pravidlá.
Ako sa princíp spravodlivého použitia (Fair Use) vzťahuje na tréning AI
V Spojených štátoch sa právna debata sústreďuje na fair use, doktrínu, ktorá umožňuje obmedzené použitie materiálu chráneného autorským právom bez súhlasu držiteľa práv. Súdy zvažujú štyri faktory pri rozhodovaní, či použitie spĺňa podmienky:
- Účel a charakter — Je nové použitie „transformačné“, pridáva niečo iné, než len nahrádza originál? Súdy zistili, že trénovanie všeobecného modelu AI na rozsiahlej, rôznorodej množine dát je vysoko transformačné, pretože model sa učí vzory, a nie reprodukuje konkrétne diela.
- Povaha pôvodného diela — Vysoko kreatívne alebo nepublikované diela požívajú silnejšiu ochranu, čo sťažuje uplatnenie princípu fair use.
- Použité množstvo — Tréning AI zvyčajne zahŕňa celé diela, čo je v rozpore s princípom fair use, hoci súdy akceptovali, že kopírovanie celých diel môže byť nevyhnutné na transformačný účel.
- Vplyv na trh — Ak výstup AI konkuruje pôvodnému dielu alebo ho nahrádza, tento faktor je v rozpore s princípom fair use. Americký úrad pre autorské práva poznamenal, že tam, kde existujú trhy s licenciami, je nelicencovaný tréning ťažšie odôvodniť.
Žiadny jednotlivý faktor nie je rozhodujúci. Každý prípad závisí od toho, ako tieto štyri faktory interagujú, a preto sudcovia dospeli ku protichodným záverom pri takmer identických faktoch.
Doterajšie prelomové rozhodnutia
Tri kľúčové rozhodnutia v USA začali načrtávať hranice. V prípade Bartz v. Anthropic federálny sudca rozhodol, že trénovanie modelu Claude na knihách bolo fair use, pretože bolo „v podstate transformačné“ – ale rozhodol, že sťahovanie pirátskych kópií týchto kníh nebolo. V prípade Kadrey v. Meta iný sudca zistil fair use, aj keď Meta získala tréningové knihy z pirátskych „tieňových knižníc“. A v prípade Thomson Reuters v. Ross Intelligence súd úplne zamietol obranu fair use a rozhodol, že použitie obsahu chráneného autorským právom konkurenciou na trénovanie vlastnej AI prekročilo hranicu.
Najsledovanejší prípad – The New York Times v. OpenAI – je stále vo fáze zisťovania. Sudca nariadil spoločnosti OpenAI, aby odovzdala 20 miliónov záznamov interakcií ChatGPT, a rozhodnutie o fair use sa neočakáva skôr ako v polovici roka 2026.
Ako Európa pristupuje inak
Európska únia sa úplne vyhýba princípu fair use. Podľa Smernice o jednotnom digitálnom trhu z roku 2019 výnimka pre dolovanie textových a dátových údajov (TDM) umožňuje komukoľvek extrahovať zákonne prístupný obsah – pokiaľ sa držiteľ práv výslovne neodhlási pomocou strojovo čitateľných protokolov, ako je robots.txt. Zákon EÚ o umelej inteligencii pridáva transparentnosť: poskytovatelia všeobecnej AI musia zverejniť „dostatočne podrobný súhrn“ svojich tréningových údajov, vrátane obsahu chráneného autorským právom.
Medzitým Spojené kráľovstvo zvažovalo rozsiahlu výnimku TDM s mechanizmom odhlásenia, ale v marci 2026 od tohto plánu upustilo po prudkom odpore zo strany kreatívneho priemyslu. Vláda uviedla, že nebude prijímať zákony, kým nenájde riešenie, ktoré uspokojí vývojárov AI aj držiteľov práv.
Prečo na tom záleží
Výsledok ovplyvní, kto bude profitovať z AI a kto zostane pozadu. Ak súdy vo všeobecnosti podporia fair use, spoločnosti zaoberajúce sa AI môžu pokračovať v trénovaní na otvorenom internete s nízkymi nákladmi. Ak tak neurobia, priemysel bude potrebovať licenčné zmluvy – potenciálne v hodnote miliárd – s vydavateľmi, umelcami a ďalšími tvorcami. Americký úrad pre autorské práva vyzval Kongres, aby vytvoril „škálovateľné mechanizmy“ na vybavovanie práv, ale legislatíva zostáva v patovej situácii.
Pre tvorcov sú stávky existenčné. Spisovatelia, výtvarní umelci a hudobníci tvrdia, že nekompenzované trénovanie znehodnocuje ich prácu. Spoločnosti zaoberajúce sa AI tvrdia, že obmedzenie tréningových údajov by koncentrovalo moc medzi niekoľko firiem, ktoré sú dostatočne bohaté na to, aby si dohodli licencie, čo by spomalilo inovácie pre všetkých.
Keďže sa očakávajú významné rozhodnutia ešte tento rok a regulačné rámce sú stále v pohybe na oboch stranách Atlantiku, právna architektúra upravujúca AI a autorské právo sa buduje v reálnom čase – jeden prípad, jeden zákon a jeden protokol odhlásenia za druhým.