El entrenamiento de modelos de inteligencia artificial (IA) depende de grandes volúmenes de datos, muchos de ellos protegidos por derechos de autor. Libros, artículos periodísticos, música, imágenes y bases de datos son utilizados sin consentimiento explícito, lo que ha llevado a una serie de demandas legales. El eje del debate: ¿es esto legal bajo el principio de “uso justo” (fair use) o se trata de una infracción de derechos?
EE.UU.: fallos divididos y doctrina del fair use
El sistema estadounidense se apoya en la figura del “fair use”, que permite el uso sin permiso de obras protegidas si cumple ciertos criterios:
- Propósito transformador o educativo
- Cantidad utilizada
- Naturaleza de la obra
- Impacto económico negativo sobre la original
Este principio ha sido clave en fallos recientes:
- Anthropic fue demandada por escritores como Andrea Bartz por entrenar su IA Claude con libros pirateados. Un juez consideró que el uso de obras compradas fue transformador, pero no así el uso de material descargado ilegalmente. En agosto de 2025 se llegó a un acuerdo preliminar.
- Meta (Facebook) ganó una demanda por el uso de libros protegidos, al considerar el tribunal que su modelo LLaMA transformaba suficientemente el contenido original.
- En contraste, OpenAI y Microsoft enfrentan una demanda activa del New York Times por usar artículos periodísticos sin consentimiento.
Otros casos destacados incluyen:
- ROSS Intelligence, por usar la base de datos Westlaw sin licencia.
- Midjourney, demandada por Disney y Universal Music por usar películas y canciones.
Europa: enfoque ético, regulador y preventivo
A diferencia de EE.UU., la Unión Europea (UE) ha optado por un marco legal más estructurado y protector. En 2024, aprobó el primer Reglamento de Inteligencia Artificial, que regula el uso de IA en función de su nivel de riesgo e impacto sobre los derechos fundamentales.
Principios clave del enfoque europeo:
- Transparencia: Las empresas deben declarar qué obras protegidas se usaron para entrenar los modelos.
- Consentimiento obligatorio: No se admite el uso de contenido protegido sin autorización expresa.
- Protección proactiva: La UE busca evitar abusos desde el diseño de los sistemas.
- Supervisión centralizada por la Comisión Europea.
Un caso relevante es la cuestión prejudicial admitida por el Tribunal de Justicia de la Unión Europea (TJUE) sobre IA generativa. Si el fallo obliga a las empresas a declarar qué datos usaron, marcará un antes y un después en la protección legal de los creadores europeos.
Además, el Parlamento Europeo ha propuesto que, si una empresa no declara explícitamente qué datos usó, se presuma automáticamente una infracción de derechos de autor.
Riesgos emergentes: chantaje y uso malicioso de IA
Más allá de los tribunales, han comenzado a surgir casos de extorsión digital vinculados al entrenamiento de IA. Un ejemplo preocupante fue el ataque a la plataforma Artists&Clients, donde hackers amenazaron con usar ilustraciones robadas para entrenar modelos de IA si no se pagaba un rescate.
Este tipo de chantaje marca una nueva forma de presión en el entorno digital. El entrenamiento de modelos con contenido robado o sin licencia no solo es un problema legal o ético, sino también una vulnerabilidad en ciberseguridad.
Estos casos refuerzan la necesidad de contar con marcos regulatorios sólidos, como el europeo, que obliguen a la trazabilidad de los datos, la protección de los creadores y el control institucional.
El uso de obras protegidas para entrenar IA plantea un dilema legal y ético global. Mientras que Estados Unidos permite usos más flexibles bajo el paraguas del fair use, Europa se posiciona como defensora de los derechos de autor, exigiendo transparencia, consentimiento y respeto al trabajo creativo. La aparición de nuevas amenazas como el chantaje digital evidencia que regular no es opcional: es urgente.