La nueva ley de IA de la Unión Europea (UE) obligará a las empresas a revelar datos de entrenamiento, creando un importante debate sobre los derechos de propiedad intelectual.

El nacimiento de ChatGPT marca un hito importante, ya que abre una era explosiva de IA generativa (Gen AI). En sólo 18 meses, esta tecnología ha atraído una enorme cantidad de inversiones y se aplica ampliamente en muchos campos. La IA generativa es una colección de aplicaciones que pueden producir rápidamente texto, imágenes y contenido de audio.

Sin embargo, además de los grandes beneficios, la IA generativa también plantea muchas cuestiones legales, especialmente la historia del origen de los datos de entrenamiento, según Reuters.

Al comprender estos desafíos, la Unión Europea (UE) ha sido pionera en la emisión de la Ley de IA, que se espera entre en vigor en los próximos dos años. Uno de los puntos más notables de esta ley es el requisito de que las organizaciones que implementan modelos de IA de propósito general, generalmente ChatGPT, deben divulgar de manera transparente los datos de capacitación. Específicamente, deben proporcionar un “resumen detallado” de las fuentes de datos utilizadas, incluidos texto, imágenes y audio.

Se espera que esta regulación resuelva en parte las preocupaciones sobre la infracción de derechos de autor cuando muchas empresas de IA son acusadas de utilizar ilegalmente libros, películas y otras obras de arte para entrenar IA sin el consentimiento del autor.

Sin embargo, esta medida enfrentó una fuerte oposición de las empresas de tecnología. Creen que revelar datos de entrenamiento es como "revelar la fórmula secreta", lo que los pone en desventaja frente a la feroz competencia.

Matthieu Riouf, director ejecutivo de Photoroom, una empresa especializada en la edición de fotografías utilizando IA, dijo: "Publicar datos de entrenamiento de IA es como obligar a un chef famoso a revelar sus recetas secretas". Esta visión también cuenta con el acuerdo de muchos otros gigantes tecnológicos como Google y Meta, que apuestan el futuro por la IA.

El nivel de detalle de estos informes de transparencia tendrá un gran impacto en las pequeñas empresas emergentes de inteligencia artificial y las grandes empresas tecnológicas como Google y Meta, que han puesto esta tecnología en el centro de sus operaciones futuras.

Durante el año pasado, varias empresas tecnológicas destacadas, incluidas Google, OpenAI y Stability AI, se enfrentaron a demandas de autores que afirmaron que su contenido se utilizó de forma inadecuada para la formación de modelos. Aunque el presidente de Estados Unidos, Joe Biden, ha emitido varias órdenes ejecutivas centradas en los riesgos de seguridad de la IA, las cuestiones sobre los derechos de autor no se han examinado plenamente. Los requisitos que obligan a las empresas de tecnología a pagar a los titulares de derechos han recibido apoyo bipartidista en el Congreso.

Bajo la presión de la opinión pública, los gigantes tecnológicos han comenzado a "apaciguar" con una serie de acuerdos de licencia de contenidos con agencias de medios. Normalmente, OpenAI ha firmado acuerdos con Financial Times y The Atlantic, mientras que Google se ha unido a la red social Reddit de NewsCorp.

Sin embargo, estas medidas todavía no son suficientes para apaciguar a la opinión pública. OpenAI siguió siendo objeto de críticas cuando la CTO Mira Murati se negó a responder preguntas sobre si la empresa utilizó vídeos de YouTube para entrenar a Sora, la herramienta de creación de vídeos de IA, o no. El incidente de la voz de IA de la actriz Scarlett Johansson en la última versión de ChatGPT ha aumentado aún más la ola de oposición a OpenAI.

En medio de la controversia, Thomas Wolf, cofundador de Hugging Face, se pronunció a favor de la transparencia de los datos, pero admitió que esta opinión no obtuvo consenso en la industria.

Mientras tanto, los legisladores europeos también tienen opiniones encontradas. El congresista Dragos Tudorache, uno de los redactores de la Ley de IA, dijo que hacer públicos los datos de entrenamiento es necesario para garantizar los derechos de los creadores de contenidos. "Tienen derecho a saber si su trabajo se utiliza para entrenar la IA", enfatizó.

La batalla entre la transparencia de los datos y los secretos comerciales en el campo de la IA se está volviendo más candente que nunca. Los expertos predicen que este será uno de los mayores desafíos que enfrentarán los responsables políticos y las empresas en el futuro cercano.