Cómo funciona la ley de derechos de autor de la IA y por qué los tribunales no se ponen de acuerdo
Las empresas de IA entrenan modelos con miles de millones de obras protegidas por derechos de autor, lo que desata demandas y legislación en todo el mundo. Así es como el uso legítimo, las normas de minería de texto y datos y las sentencias judiciales históricas están dando forma a la batalla legal sobre los datos de entrenamiento de la IA.
La pregunta del billón de dólares
Todos los principales modelos generativos de IA, desde ChatGPT hasta Claude y Midjourney, se entrenaron con vastas cantidades de texto, imágenes y código extraídos de Internet. Gran parte de ese material está protegido por derechos de autor. Si las empresas de IA necesitan permiso para utilizarlo es ahora la cuestión de propiedad intelectual más trascendental de la década, con más de 50 demandas pendientes solo en los tribunales estadounidenses y reguladores en tres continentes redactando nuevas normas.
Cómo se aplica el uso legítimo al entrenamiento de la IA
En Estados Unidos, el debate legal se centra en el uso legítimo (fair use), una doctrina que permite el uso limitado de material protegido por derechos de autor sin el consentimiento del titular de los derechos. Los tribunales sopesan cuatro factores a la hora de decidir si un uso cumple los requisitos:
- Propósito y carácter: ¿Es el nuevo uso "transformador", que añade algo diferente en lugar de sustituir al original? Los tribunales han dictaminado que el entrenamiento de un modelo de IA de propósito general con un conjunto de datos grande y diverso es altamente transformador porque el modelo aprende patrones en lugar de reproducir obras específicas.
- Naturaleza de la obra original: Las obras muy creativas o inéditas reciben una mayor protección, lo que dificulta la reivindicación del uso legítimo.
- Cantidad utilizada: El entrenamiento de la IA suele ingerir obras completas, lo que va en contra del uso legítimo, aunque los tribunales han aceptado que la copia de obras enteras puede ser necesaria para un propósito transformador.
- Efecto en el mercado: Si el resultado de una IA compite con la obra original o la sustituye, este factor va en contra del uso legítimo. La Oficina de Derechos de Autor de EE. UU. ha señalado que cuando existen mercados de licencias, el entrenamiento sin licencia es más difícil de justificar.
Ningún factor por sí solo es decisivo. Cada caso depende de cómo interactúan los cuatro, razón por la cual los jueces han llegado a conclusiones contradictorias sobre hechos casi idénticos.
Sentencias históricas hasta el momento
Tres decisiones clave en EE. UU. han comenzado a esbozar los límites. En Bartz v. Anthropic, un juez federal dictaminó que entrenar a Claude con libros era un uso legítimo porque era "esencialmente transformador", pero dictaminó que descargar copias pirateadas de esos libros no lo era. En Kadrey v. Meta, un juez diferente encontró un uso legítimo a pesar de que Meta obtuvo libros de entrenamiento de "bibliotecas en la sombra" pirateadas. Y en Thomson Reuters v. Ross Intelligence, el tribunal rechazó por completo la defensa del uso legítimo, dictaminando que el uso de contenido legal protegido por derechos de autor por parte de un competidor para entrenar su propia IA cruzaba la línea.
El caso de más alto perfil, The New York Times v. OpenAI, aún está en fase de presentación de pruebas. Un juez ha ordenado a OpenAI que entregue 20 millones de registros de interacción de ChatGPT, y no se espera un fallo sobre el uso legítimo antes de mediados de 2026 como muy pronto.
Cómo Europa toma un camino diferente
La Unión Europea evita por completo el uso legítimo. En virtud de la Directiva sobre el mercado único digital de 2019, una excepción de minería de textos y datos (MTD) permite a cualquiera extraer contenido legalmente accesible, a menos que el titular de los derechos se excluya explícitamente utilizando protocolos legibles por máquina como robots.txt. La Ley de IA de la UE añade transparencia: los proveedores de IA de propósito general deben publicar un "resumen suficientemente detallado" de sus datos de entrenamiento, incluido el contenido protegido por derechos de autor.
Mientras tanto, el Reino Unido consideró una amplia exención de MTD con un mecanismo de exclusión voluntaria, pero abandonó el plan en marzo de 2026 tras la feroz oposición de las industrias creativas. El gobierno dijo que no legislaría hasta que encontrara una solución que satisfaga tanto a los desarrolladores de IA como a los titulares de derechos.
Por qué es importante
El resultado determinará quién se beneficia de la IA y quién se queda atrás. Si los tribunales respaldan ampliamente el uso legítimo, las empresas de IA pueden seguir entrenando en la Internet abierta a bajo costo. Si no lo hacen, la industria necesitará acuerdos de licencia, potencialmente por valor de miles de millones, con editores, artistas y otros creadores. La Oficina de Derechos de Autor de EE. UU. ha instado al Congreso a crear "mecanismos escalables" para la autorización de derechos, pero la legislación sigue estancada.
Para los creadores, lo que está en juego es existencial. Los escritores, artistas visuales y músicos argumentan que el entrenamiento no remunerado devalúa su trabajo. Las empresas de IA replican que restringir los datos de entrenamiento concentraría el poder entre unas pocas empresas lo suficientemente ricas como para negociar licencias, lo que ralentizaría la innovación para todos.
Con importantes fallos esperados a finales de este año y marcos regulatorios aún en evolución a ambos lados del Atlántico, la arquitectura legal que rige la IA y los derechos de autor se está construyendo en tiempo real: un caso, un estatuto y un protocolo de exclusión voluntaria a la vez.