Wie das Urheberrecht für KI funktioniert – und warum Gerichte unterschiedlicher Meinung sind
KI-Unternehmen trainieren Modelle mit Milliarden urheberrechtlich geschützter Werke, was weltweit zu Klagen und Gesetzen führt. Hier erfahren Sie, wie Fair Use, Text-Data-Mining-Regeln und wegweisende Gerichtsurteile den Rechtsstreit um KI-Trainingsdaten prägen.
Die Milliarden-Dollar-Frage
Jedes größere generative KI-Modell – von ChatGPT über Claude bis hin zu Midjourney – wurde mit riesigen Mengen an Texten, Bildern und Code trainiert, die aus dem Internet gescraped wurden. Ein Großteil dieses Materials ist urheberrechtlich geschützt. Ob KI-Unternehmen eine Genehmigung für die Nutzung benötigen, ist nun die wichtigste Frage des geistigen Eigentums des Jahrzehnts, mit mehr als 50 anhängigen Klagen allein vor US-Gerichten und Regulierungsbehörden auf drei Kontinenten, die neue Regeln schreiben.
Wie Fair Use auf KI-Training angewendet wird
In den Vereinigten Staaten dreht sich die rechtliche Debatte um Fair Use, eine Doktrin, die die begrenzte Nutzung urheberrechtlich geschützten Materials ohne Zustimmung des Rechteinhabers erlaubt. Gerichte wägen vier Faktoren ab, wenn sie entscheiden, ob eine Nutzung als Fair Use gilt:
- Zweck und Charakter – Ist die neue Nutzung „transformierend“ und fügt etwas Neues hinzu, anstatt das Original zu ersetzen? Gerichte haben festgestellt, dass das Training eines Allzweck-KI-Modells mit einem großen, vielfältigen Datensatz in hohem Maße transformierend ist, da das Modell Muster lernt, anstatt bestimmte Werke zu reproduzieren.
- Art des Originalwerks – Sehr kreative oder unveröffentlichte Werke erhalten einen stärkeren Schutz, was es schwieriger macht, Fair Use geltend zu machen.
- Verwendete Menge – KI-Training nimmt typischerweise ganze Werke auf, was gegen Fair Use spricht, obwohl Gerichte akzeptiert haben, dass das Kopieren ganzer Werke für einen transformierenden Zweck notwendig sein kann.
- Markteffekt – Wenn die Ausgabe einer KI mit dem Originalwerk konkurriert oder es ersetzt, spricht dieser Faktor gegen Fair Use. Das U.S. Copyright Office hat festgestellt, dass, wo Lizenzmärkte existieren, unlizenzierte Schulungen schwerer zu rechtfertigen sind.
Kein einzelner Faktor ist entscheidend. Jeder Fall hängt davon ab, wie die vier Faktoren interagieren, weshalb Richter zu widersprüchlichen Schlussfolgerungen bei nahezu identischen Fakten gelangt sind.
Bisherige wegweisende Urteile
Drei wichtige US-Entscheidungen haben begonnen, die Grenzen abzustecken. In Bartz v. Anthropic urteilte ein Bundesrichter, dass das Training von Claude mit Büchern Fair Use sei, weil es „in höchstem Maße transformierend“ sei – stellte aber fest, dass das Herunterladen raubkopierter Exemplare dieser Bücher dies nicht sei. In Kadrey v. Meta befand ein anderer Richter Fair Use, obwohl Meta Trainingsbücher aus raubkopierten „Schattenbibliotheken“ bezog. Und in Thomson Reuters v. Ross Intelligence wies das Gericht die Fair-Use-Verteidigung vollständig zurück und urteilte, dass die Nutzung urheberrechtlich geschützter Rechtsinhalte durch einen Wettbewerber zum Trainieren seiner eigenen KI die Grenze überschritt.
Der aufsehenerregendste Fall – The New York Times v. OpenAI – befindet sich noch in der Beweisaufnahme. Ein Richter hat OpenAI angewiesen, 20 Millionen ChatGPT-Interaktionsprotokolle auszuhändigen, und eine Entscheidung über Fair Use wird frühestens Mitte 2026 erwartet.
Wie Europa einen anderen Weg einschlägt
Die Europäische Union umgeht Fair Use vollständig. Gemäß der Richtlinie über den digitalen Binnenmarkt von 2019 erlaubt eine Ausnahme für Text- und Data-Mining (TDM) jedem, rechtmäßig zugängliche Inhalte zu scrapen – es sei denn, der Rechteinhaber widerspricht ausdrücklich unter Verwendung maschinenlesbarer Protokolle wie robots.txt. Der EU AI Act legt Transparenz darüber: Anbieter von Allzweck-KI müssen eine „hinreichend detaillierte Zusammenfassung“ ihrer Trainingsdaten veröffentlichen, einschließlich urheberrechtlich geschützter Inhalte.
Das Vereinigte Königreich erwog unterdessen eine breite TDM-Ausnahme mit Opt-out-Mechanismus, gab den Plan aber im März 2026 nach heftigem Widerstand der Kreativwirtschaft auf. Die Regierung sagte, sie werde erst dann Gesetze erlassen, wenn sie eine Lösung finde, die sowohl KI-Entwickler als auch Rechteinhaber zufriedenstelle.
Warum es wichtig ist
Das Ergebnis wird bestimmen, wer von KI profitiert und wer zurückgelassen wird. Wenn Gerichte Fair Use breit unterstützen, können KI-Unternehmen weiterhin im offenen Internet zu geringen Kosten trainieren. Wenn nicht, benötigt die Branche Lizenzvereinbarungen – potenziell im Wert von Milliarden – mit Verlagen, Künstlern und anderen Urhebern. Das U.S. Copyright Office hat den Kongress aufgefordert, „skalierbare Mechanismen“ für die Rechteklärung zu schaffen, aber die Gesetzgebung ist weiterhin ins Stocken geraten.
Für Urheber steht die Existenz auf dem Spiel. Schriftsteller, bildende Künstler und Musiker argumentieren, dass unentgeltliches Training ihre Arbeit entwertet. KI-Unternehmen entgegnen, dass die Einschränkung von Trainingsdaten die Macht auf einige wenige Unternehmen konzentrieren würde, die reich genug sind, um Lizenzen auszuhandeln, was die Innovation für alle verlangsamen würde.
Da noch in diesem Jahr wichtige Urteile erwartet werden und die regulatorischen Rahmenbedingungen auf beiden Seiten des Atlantiks noch im Fluss sind, wird die Rechtsarchitektur für KI und Urheberrecht in Echtzeit aufgebaut – ein Fall, ein Gesetz und ein Opt-out-Protokoll nach dem anderen.
Bleib auf dem Laufenden!
Folge uns auf Facebook für die neuesten Nachrichten und Artikel.
Folge uns auf Facebook