El Centro de Informes de Investigación (CIR) ha demandado a OpenAI y al gigante tecnológico Microsoft por presunta infracción de derechos de autor. 

La demanda, presentada en un tribunal federal de Nueva York, acusa a ambas empresas de utilizar contenido de las publicaciones de CIR, incluidos Mother Jones y el podcast Reveal, sin la autorización o compensación adecuada. Esto marca otro desafío legal para OpenAI luego del lanzamiento de su popular modelo de IA, ChatGPT.

Detalles de la demanda

Según la denuncia, OpenAI y Microsoft han utilizado grandes cantidades de contenido periodístico de CIR para entrenar sus modelos de inteligencia artificial, específicamente las versiones anteriores de ChatGPT. El análisis realizado por un científico de datos reveló que la base de datos OpenWebText, utilizada por OpenAI, contenía más de 17.000 URL de Mother Jones y más de 400 de Reveal. 

[Demanda por derechos de autor de IA] El Centro de Informes de Investigación (detrás de @MotherJones y @reveal) demanda a OpenAI y Microsoft por infracción de derechos de autor. Citas: "Los demandados copiaron, usaron, compendieron y mostraron el valioso contenido de CIR sin el permiso o autorización de CIR, y... pic.twitter.com/SeZ0VtDOMY

– Luiza Jarovsky (@LuizaJarovsky) 29 de junio de 2024

Estas cifras apuntan a un uso sustancial de materiales protegidos por derechos de autor recopilados a través de procesos que supuestamente quitaron a los artículos los encabezados, pies de página y avisos de derechos de autor para centrarse únicamente en el contenido del artículo.

Monika Bauerlein, directora ejecutiva de CIR, afirmó: “La explotación del periodismo para obtener ganancias corporativas sin una compensación justa socava los cimientos mismos de nuestro trabajo”. La demanda enfatiza que los acusados ​​podrían haber optado por respetar las obras periodísticas pero optaron por no hacerlo.

Preocupaciones tecnológicas y éticas

La denuncia detalla con más detalle las tecnologías utilizadas por OpenAI, como los algoritmos Dragnet y Newspaper, diseñados para extraer el contenido principal de las páginas web y al mismo tiempo omitir elementos esenciales como los nombres de los autores y la información de derechos de autor. 

El demandante argumenta que este método de extracción de datos facilitó la infracción de derechos de autor a gran escala, impactando directamente los ingresos y derechos de los creadores de contenido original. Además, la demanda alega que Microsoft era consciente de que los datos extraídos carecían de información de identificación esencial, lo que contribuyó a los problemas de infracción que ahora cuestionan las funcionalidades de Bing AI y ChatGPT.

Implicaciones y acciones legales previas

Esta demanda se suma a la creciente lista de batallas legales que OpenAI y Microsoft han enfrentado en relación con cuestiones de derechos de autor desde la introducción de ChatGPT. Otras publicaciones destacadas, como el New York Times, The Intercept, el New York Daily News y el Chicago Tribune, también han iniciado procedimientos legales contra las entidades tecnológicas.

Por el contrario, varios editores y plataformas digitales destacados han optado por acuerdos de licencia con OpenAI, lo que permite el uso legal de sus archivos. Las asociaciones con entidades como TIME Magazine, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow y Reddit resaltan un enfoque diferente para gestionar el uso expansivo de materiales protegidos por derechos de autor por parte de la IA.

El Centro de Reportajes de Investigación busca una compensación por el presunto uso no autorizado de sus obras protegidas por derechos de autor, incluidas las ganancias obtenidas por OpenAI y Microsoft a través del contenido de CIR. La indemnización solicitada incluye un mínimo de 750 dólares por cada obra infringida y 2.500 dólares por cada violación de la Ley de Derechos de Autor del Milenio Digital.

A medida que se desarrollen los procedimientos legales, el resultado de este caso podría tener implicaciones significativas para las operaciones de las empresas de IA y su uso de contenido digital disponible públicamente en el entrenamiento de modelos de IA. Tanto la comunidad tecnológica como los titulares de derechos de autor están observando atentamente estos desarrollos, que establecerán precedentes en la intersección de la tecnología de inteligencia artificial y la ley de derechos de autor.

La publicación CIR presenta una nueva demanda por infracción de derechos de autor contra OpenAI y Microsoft apareció por primera vez en Coinfea.