Cloudflare lancia uno strumento gratuito per bloccare i crawler AI con un clic

Dopo la crescita esplosiva degli strumenti di intelligenza artificiale generativa, le controversie sul copyright tra i creatori e le opere generate dall’intelligenza artificiale hanno continuato a verificarsi. Molti creatori temono che i loro lavori vengano portati via dai robot IA in qualsiasi momento, e ora potrebbe esserci una potenziale soluzione.

Cloudflare, un noto servizio cloud e piattaforma di sicurezza informatica, ha recentemente annunciato di aver lanciato un nuovo strumento gratuito, sostenendo che gli utenti possono impedire che i dati dei loro siti Web ospitati vengano utilizzati per addestrare modelli di intelligenza artificiale purché attivino Bot Fight Modalità nella pagina di sicurezza.

一張含有 文字, 螢幕擷取畫面, 字型 的圖片

自動產生的描述Fonte immagine: Cloudflare Cloudflare lancia uno strumento gratuito per bloccare i crawler AI con un clic

In che modo Cloudflare monitora i crawler dei bot AI?

Attualmente, i fornitori che forniscono servizi di intelligenza artificiale, come Google, OpenAI e Apple, consentono ai proprietari di siti Web di modificare robots.txt per impedire ai propri robot di eseguire la scansione dei dati. Tuttavia, l’ultimo rapporto di Cloudflare sottolinea che non tutti i siti Web possono bloccarlo con successo gli strumenti del crawler eseguono la scansione dei dati.

Ad esempio, il robot crawler AI numero uno è Bytespider (sviluppato dalla società cinese ByteDance Company), che esegue con un'alta frequenza la scansione dei dati dei siti Web e viene rifiutato dai crawler. Il prossimo è GPTBot, gestito da OpenAI, che è appositamente progettato per la scansione del suo prodotto ChatGPT. Ottieni dati.

Cloudflare ha sottolineato che sebbene i proprietari di siti web possano modificare robot.txt per vietare GPTBot, CCBot e i robot di Google, molte persone potrebbero non essere a conoscenza di robot sconosciuti come Bytespider e ClaudeBot, quindi non li hanno inseriti nella lista nera.

Per risolvere questo problema, Cloudflare ha analizzato il traffico dei bot e dei crawler AI per mettere a punto il modello di rilevamento automatico dei bot. Tra gli altri fattori, il modello di Cloudflare monitora se i robot IA imitano il comportamento degli esseri umani reali per eludere il rilevamento.

Industria dei media, i creatori stanno combattendo contro i crawler dell'intelligenza artificiale

Una ricerca del settembre 2023 ha rilevato che circa il 26% dei 100 siti Web più trafficati a livello globale hanno bloccato GPTBot, mentre un altro studio ha rilevato che più di 600 organi di stampa hanno bloccato il bot anche per conto dei proprietari di siti Web. I produttori di contenuti e i produttori di contenuti stanno impedendo i crawler dell'intelligenza artificiale dal causare un uso arbitrario delle loro opere.

Alcuni creatori e media hanno intrapreso azioni più dirette, menzionando direttamente le società di intelligenza artificiale. I media stranieri "Axios" hanno dato la notizia che, secondo una copia della lettera visionata, "Forbes" avrebbe inviato direttamente una lettera per avvertire l'amministratore delegato della società di ricerca AI Perplexity, avvertendolo di rubare testo e immagini e violare intenzionalmente il diritto d'autore.

Anche la Recording Industry Association of America ha recentemente annunciato di aver intentato una causa contro gli strumenti di intelligenza artificiale generativa musicale Udio e Suno, accusandoli di violazione su larga scala dei diritti di proprietà intellettuale.