Cloudflare lance un outil gratuit pour bloquer les robots d'exploration IA en un seul clic

Depuis la croissance explosive des outils d’IA générative, les conflits de droits d’auteur entre les créateurs et les œuvres générées par l’IA ont continué à survenir. De nombreux créateurs craignent que leurs œuvres soient à tout moment balayées par des robots IA, et il existe peut-être désormais une solution potentielle.

Cloudflare, une plateforme bien connue de services cloud et de sécurité de l'information, a récemment annoncé le lancement d'un nouvel outil gratuit, affirmant que les utilisateurs peuvent empêcher que les données de leurs sites Web hébergés soient utilisées pour entraîner des modèles d'IA tant qu'ils activent Bot Fight. Mode dans la page de sécurité.

一張含有 文字, 螢幕擷取畫面, 字型 的圖片

自動產生的描述Source de l'image : Cloudflare Cloudflare lance un outil gratuit pour empêcher les robots d'exploration IA en un seul clic

Comment Cloudflare surveille-t-il les robots d'exploration IA ?

Actuellement, les fournisseurs qui fournissent des services d’IA, tels que Google, OpenAI et Apple, autorisent les propriétaires de sites Web à modifier le fichier robots.txt pour empêcher leurs robots d’explorer les données. Cependant, le dernier rapport de Cloudflare souligne que tous les sites Web ne parviennent pas à le bloquer. les outils d'exploration explorent les données.

Par exemple, le robot d'exploration d'IA numéro un est Bytespider (développé par la société chinoise ByteDance), qui explore une fréquence élevée de données de sites Web et est rejeté par les robots. Vient ensuite GPTBot, géré par OpenAI, spécialement conçu pour explorer son produit. ChatGPT. Obtenez des données.

Cloudflare a souligné que même si les propriétaires de sites Web peuvent modifier le fichier robot.txt pour interdire les robots GPTBot, CCBot et Google, de nombreuses personnes ne connaissent peut-être pas l'existence de robots inconnus tels que Bytespider et ClaudeBot et ne les ont donc pas mis sur liste noire.

Pour résoudre ce problème, Cloudflare a analysé le trafic des robots IA et des robots d'exploration pour affiner son modèle de détection automatique des robots. Entre autres facteurs, le modèle de Cloudflare vérifie si les robots IA imitent le comportement de vrais humains afin d'échapper à la détection.

Industrie des médias, les créateurs se battent contre les robots d'exploration de l'IA

Une étude de septembre 2023 a révélé qu'environ 26 % des 100 sites Web les plus fréquentés au monde ont bloqué GPTBot, tandis qu'une autre étude a noté que plus de 600 médias ont également bloqué le bot au nom des propriétaires de sites Web. Les producteurs de contenu et les producteurs de contenu empêchent les robots d'exploration de l'IA. de provoquer un usage arbitraire de leurs œuvres.

Certains créateurs et médias ont pris des mesures plus directes, c’est-à-dire en mentionnant directement les entreprises d’IA. Le média étranger "Axios" a annoncé que, selon une copie de la lettre qu'ils ont vue, "Forbes" semblait avoir directement envoyé une lettre pour avertir le PDG de la société de recherche d'IA Perplexity, l'avertissant de voler du texte et des images et violer intentionnellement le droit d'auteur.

La Recording Industry Association of America a également récemment annoncé qu'elle avait intenté une action en justice contre les outils d'IA génératrice de musique Udio et Suno, les accusant de violation à grande échelle des droits de propriété intellectuelle.