Cloudflare lanza una herramienta gratuita para bloquear rastreadores de IA con un solo clic

Desde el crecimiento explosivo de las herramientas de IA generativa, han seguido produciéndose disputas por derechos de autor entre creadores y obras generadas por IA. A muchos creadores les preocupa que sus obras sean arrastradas por robots de inteligencia artificial en cualquier momento, y ahora puede haber una posible solución.

Cloudflare, un conocido servicio en la nube y plataforma de seguridad de la información, anunció recientemente que ha lanzado una nueva herramienta gratuita, afirmando que los usuarios pueden evitar que los datos de sus sitios web alojados se utilicen para entrenar modelos de IA siempre que activen Bot Fight. Modo en la página de seguridad.

一張含有 文字, 螢幕擷取畫面, 字型 的圖片

自動產生的描述Fuente de la imagen: Cloudflare Cloudflare lanza una herramienta gratuita para evitar los rastreadores de IA con un solo clic

¿Cómo monitorea Cloudflare los rastreadores de bots de IA?

Actualmente, los proveedores que brindan servicios de inteligencia artificial, como Google, OpenAI y Apple, permiten a los propietarios de sitios web modificar el archivo robots.txt para evitar que sus robots rastreen datos. Sin embargo, el último informe de Cloudflare señala que no todos los sitios web pueden bloquearlo con éxito. Las herramientas de rastreo rastrean datos.

Por ejemplo, el robot rastreador de IA mejor clasificado es Bytespider (desarrollado por ByteDance Company de China), que tiene una alta frecuencia de rastreo de datos de sitios web y de ser rechazado por los rastreadores. El siguiente es GPTBot, administrado por OpenAI, que está especialmente diseñado para rastrearlos. Producto ChatGPT. Obtener datos.

Cloudflare señaló que aunque los propietarios de sitios web pueden modificar robot.txt para prohibir los robots GPTBot, CCBot y Google, es posible que muchas personas no conozcan robots desconocidos como Bytespider y ClaudeBot, por lo que no los han incluido en la lista negra.

Para resolver este problema, Cloudflare analizó el tráfico de rastreadores y robots de IA para ajustar su modelo de detección automática de bots. Entre otros factores, el modelo de Cloudflare monitorea si los robots de IA imitan el comportamiento de humanos reales para evadir la detección.

La industria de los medios y los creadores luchan contra los rastreadores de IA

Una investigación de septiembre de 2023 señaló que alrededor del 26% de los 100 sitios web con mayor tráfico a nivel mundial han bloqueado GPTBot, mientras que otro estudio señaló que más de 600 medios de comunicación también han bloqueado el bot en nombre de los propietarios de sitios web. Los productores de contenido y los productores de contenido están impidiendo a los rastreadores de IA. de provocar un uso arbitrario de sus obras.

Algunos creadores y medios han tomado acciones más directas, es decir, mencionando directamente a las empresas de IA. Los medios extranjeros "Axios" dieron la noticia de que, según una copia de la carta que vieron, "Forbes" parecía haber enviado directamente una carta para advertir al director ejecutivo de la empresa de búsqueda de inteligencia artificial Perplexity, advirtiéndole que robara texto e imágenes y infringir intencionalmente los derechos de autor.

La Recording Industry Association of America también anunció recientemente que ha presentado una demanda contra las herramientas de inteligencia artificial generativa de música Udio y Suno, acusándolas de infracción a gran escala de los derechos de propiedad intelectual.