En 2022, año de lanzamiento de ChatGPT, «inteligencia artificial» fue el término del año para la Fundeu. Atención, porque en 2023 la palabra elegida fue «polarización». Pues bien, una especie de amalgama de ambas es lo que hemos observado al conocer las reacciones -unas airadas, otras celebratorias- que ha generado el fallo de la sentencia emitida por el Tribunal del Distrito de Nueva York el 7 de noviembre de 2024 en el caso Raw Story Media, Inc. y Alternet Media, Inc contra OpenAI.
Esta sentencia se pronunciaba sobre una demanda interpuesta por dos entidades que se dedican a la explotación de contenidos periodísticos frente a OpenAI, por haber cometido esta, a decir de las demandantes, una violación de sus derechos de autor al entrenar los modelos de ChatGPT con obras y prestaciones protegidas de las demandantes.
La jueza del caso, Colleen McMahon, falló a favor de OpenIA, dejando algunas declaraciones que han tenido gran eco mediático, como que las posibilidades de que ChatGPT genere contenido que suponga un plagio de aquel con el que ha sido entrenado es «remota»:
«(…) dada la cantidad de información contenida en el repositorio -previamente se alude a que los demandantes acusan a ChatGPT de estar haciendo scraping de toda internet-, la probabilidad de que ChatGPT genere contenido plagiado de uno de los artículos de los Demandantes parece remota»
Algunos han querido ver esta afirmación y la propia desestimación de la demanda como una victoria general de las empresas desarrolladores de IA sobre los titulares de derechos de las obras con las que se lleva a cabo su entrenamiento. ¡Ya tenemos el aval jurisprudencial que necesitamos! ¡Fair use para todos!
Sin embargo, para una correcta comprensión de la envergadura de este fallo -que, ya adelantamos, no es tan determinante como parece- debemos profundizar en qué contexto se realizan las afirmaciones de la jueza McMahon y aportar todos los matices sobre la causa judicial y sobre la resolución comentada. Intentamos ofrecer, a continuación, algunas claves.
En primer lugar, ha de tenerse en cuenta que se trata de una desestimación por motivos procesales, en este caso -muy sintéticamente- por apreciarse una falta de legitimación activa para reclamar daños y solicitar medidas cautelares teniendo en cuenta el tipo de infracción alegada. En derecho anglosajón, este instituto es conocido como motion to dismiss, y aunque es cierto que determina una desestimación inicial de la demanda, nada impide que el demandante pueda -en prensa, ha anunciado que lo hará- volver a presentar la demanda habiendo subsanado los defectos. En ese caso, se volvería a enjuiciar el fondo del asunto, lo que obligaría a una revisión de la causa a la luz de los nuevos documentos y enfoque aportado.
Por otro lado, debemos poner en contexto esa calificación como remotas de las probabilidades de que ChatGPT plagie contenidos -lo que, de una primera lectura, parecería ser el principal motivo que lleva a la desestimación y donde se ha querido ver una afirmación extrapolable a las demandas en curso contra los grandes desarrolladores de IA. Pues bien, estas manifestaciones se realizan en un contexto muy concreto: si procedía acordar medidas cautelares de cesación en el uso del contenido de los demandantes, siendo que la premisa para ello era que se materializara el riesgo de infracción, que venía circunscrito a que los contenidos de los demandantes resultaran reproducidos, de manera literal o casi literal, como output por la herramienta. Ese riesgo y no otro fue el que resultó objeto de análisis y valoración. Y en este contexto, la sentencia entiende que, aunque los demandantes proporcionan estadísticas de terceros que indican que una versión anterior de ChatGPT sí generaba respuestas con cantidades significativas de contenido plagiado, no se había podido acreditar este riesgo sustancial en relación con la versión actual de ChatGPT.
En la misma línea han de valorarse las manifestaciones sobre si se ha podido acreditar o no un daño a los demandantes: si el daño, según su estrategia, solo deriva a de la reproducción literal o casi literal de sus contenidos protegidos y se entiende, en una primera valoración, que el riesgo de que ello suceda no es alto, las posibilidades de acreditar un daño real se estrechan de manera sustancial. Ello, lógicamente, no implica -como parecía desprenderse de algunos titulares apresurados-, que la sentencia niegue de manera general que los titulares de derechos puedan sufrir daños por el uso de sus obras protegidas en sistemas de IA.
En general, el principal problema con el que parecen haberse encontrado los demandantes ha sido, precisamente, su estrategia procesal. Por un lado, por haber planteado la demanda sobre la base de que la conducta infractora únicamente podría materializarse con la reproducción literal de contenidos como output -y no, por ejemplo, a través del propio uso de los contenidos para el entrenamiento-. Por el otro, por haber basado su estrategia no en la legislación de copyright, sino en la vulneración de la Digital Millenium Copyright Act., una normativa cuya función es la de proteger el buen funcionamiento de los mercados electrónicos, pero no tanto la de salvaguardar derechos de propiedad de los agentes o individuos que operan en ellos. Los demandantes entienden que se ha vulnerado esta normativa al haber eliminado OpenIA las medidas de seguridad -CMI o Copyright Management Information, en sus siglas en inglés- con las que sus contenidos contaban, constituyendo este hecho en sí mismo una infracción, pero siendo esta una infracción de distinto tipo que las basadas en vulneración de derechos de propiedad intelectual. Este enfoque, que estrecha bastante el recorrido de la demanda, les ha dificultado obtener los remedios legales que solicitaban.
Como conclusión, sin restarle interés ni relevancia a la decisión judicial, lo cierto es que esta no va a ser la bandera que permita, de una vez y para siempre, a los desarrolladores de sistemas de IA de EEUU usar contenidos protegidos para el entrenamiento de sus modelos sin infringir derechos. Las reflexiones que realiza -y que, como decimos, podrían incluso cambiar si se presenta la demanda enmendada- se enmarcan en la valoración de aspectos muy concretos que no admiten la generalización que de ellas se ha querido realizar.
A veces, mal que nos pese, debemos asumir que la realidad -en este caso, encarnada en la letra pequeña de una sentencia- nos puede estropear un gran titular.
Violeta Arnaiz. Directora de Propiedad Intelectual tecnológica de PONS IP