OpenAI y Microsoft se enfrentan a una nueva demanda del Centro de Informes de Investigación (CIR). El CIR dice que OpenAI ha utilizado su contenido publicado en los sitios web Mother Jones y Reveal para entrenar versiones anteriores de ChatGPT.

Lea también: OpenAI elimina la voz de ChatGPT después de la controversia de Scarlett Johansson 

El demandante del CIR afirma que OpenAI utilizó su contenido sin permiso ni promesa de compensación. CIR, fundado en 1977, opera la revista estadounidense sin fines de lucro Mother Jones y el podcast Reveal. 

CIR demanda a OpenAI y Microsoft por infracción de derechos de autor 

El Centro de Reportajes de Investigación (CIR) presentó la demanda ante un tribunal federal de Nueva York el jueves. La organización sin fines de lucro acusó a OpenAI y Microsoft de utilizar su contenido sin permiso ni compensación. El CIR dice que OpenAI ha violado las leyes de derechos de autor al utilizar su contenido para entrenar ChatGPT.

La directora ejecutiva de CIR, Monika Bauerlein, afirmó: “Este comportamiento de aprovechamiento no sólo es injusto, sino que también constituye una violación de los derechos de autor. El trabajo de los periodistas, en el CIR y en todas partes, es valioso y OpenAI y Microsoft lo saben”.

🚨[Demanda por derechos de autor de IA] El Centro de Informes de Investigación (detrás de @MotherJones y @reveal) demanda a OpenAI y Microsoft por infracción de derechos de autor. Citas:

"Los demandados copiaron, usaron, resumieron y mostraron el valioso contenido de CIR sin el permiso o autorización de CIR, y... pic.twitter.com/SeZ0VtDOMY

– Luiza Jarovsky (@LuizaJarovsky) 29 de junio de 2024

En la denuncia oficial, el demandante contrató a un científico de datos para analizar la base de datos OpenWebText. OpenWebText es una aproximación de WebText, que es un corpus de páginas web raspadas creadas por OpenAI. El científico de datos descubrió que el conjunto de datos contiene 17.434 URL de Mother Jones y 415 de Reveal. OpenWebText y WebText tienen números ligeramente diferentes de artículos de Mother Jones porque el proceso de extracción se realizó en días diferentes.

El demandante dijo en la denuncia oficial,

“Cuando poblaron sus conjuntos de formación con trabajos de periodismo, los acusados ​​tuvieron una opción: respetar los trabajos de periodismo o no. Los acusados ​​eligieron lo último”

Lea también: El científico jefe de OpenAI, Ilya Sutskever, se despide

OpenAI utilizó dos algoritmos, Dragnet y Newspaper, para construir la base de datos WebText. Dragnet está diseñado para separar el contenido del artículo principal de otras partes del sitio web, como el encabezado, el pie de página, el título, el nombre del autor y los avisos de derechos de autor. Cuando OpenAI eliminó el sitio web de Mother Jones, eliminó todo lo que había en el pie de página y en el encabezado. Además, el creador de ChatGPT eliminó el aviso de derechos de autor y la información sobre los términos de uso según la queja. 

Además, el demandante afirma que Microsoft sabía que las URL eliminadas tenían contenido periodístico sin nombres de autores, títulos ni avisos de derechos de autor, lo que facilitaba la infracción de derechos de autor por parte de Bing AI y ChatGPT.

El CIR busca ganancias de OpenAI y Microsoft y daños reales o legales. La cantidad indicada es un mínimo de $750 por trabajo infringido y $2,500 por violación de la DMCA.

OpenAI enfrenta demandas de otras publicaciones

Esta no es la primera demanda presentada contra OpenAI por infracción de derechos de autor. Desde el lanzamiento de ChatGPT a finales de 2022, OpenAI y Microsoft se han enfrentado a numerosas demandas de grandes nombres como el New York Times, The Intercept, el New York Daily News y el Chicago Tribune.

Lea también: Los empleados afirman que OpenAI y Google DeepMind ocultan los riesgos de la IA

Mientras tanto, algunas editoriales importantes y gigantes de Internet han firmado acuerdos de licencia con OpenAI, dándole acceso a sus archivos. Estos incluyen la revista TIME, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow y Reddit.

Informe criptopolitano de Randa Moses