I funzionari di Amazon hanno affermato che la divisione cloud dell'azienda sta indagando sulle affermazioni secondo cui la startup AI Perplexity sta eliminando contenuti dai siti Web senza alcuna approvazione. Lo sviluppo è arrivato dopo che diversi organi di stampa hanno accusato Perplexity di aver estratto illegalmente contenuti.

Perplexity AI sta presumibilmente ignorando lo standard web chiamato Robots Exclusion Protocol. Secondo un rapporto di WIRED, il protocollo è comunemente noto come robots.txt, in base al quale i siti Web definiscono a quali pagine possono accedere i motori di ricerca, l'intelligenza artificiale e altri crawler. Forbes ha anche accusato la startup di intelligenza artificiale di plagiare il lavoro dei giornalisti.

Leggi anche: SoftBank investe nell'alternativa Perplexity AI di Google con una valutazione di 3 miliardi di dollari

La conformità con robots.txt è obbligatoria per i siti che utilizzano hosting o server Amazon Web Services (AWS). Sebbene la maggior parte dei siti web segua lo standard, la legge non obbliga nessuno a seguire il protocollo.

Presumibilmente Perplexity viola gli standard web

La portavoce di Amazon, Samantha Mayowa, ha detto venerdì che l’azienda stava valutando le informazioni sulla violazione del protocollo da parte di Perplexity. Un organo di stampa, WIRED, ha accusato Perplexity di sottrarre contenuti da siti di notizie che proibiscono tali pratiche. È importante ricordare che Perplexity utilizza AWS per le sue esigenze di server.

Mayowa ha detto in una dichiarazione che, 

"I termini di servizio [di Amazon] vietano attività abusive e illegali e i nostri clienti sono responsabili del rispetto di tali termini", Fonte: AP.

Il portavoce ha affermato che la società riceve regolarmente denunce da varie fonti riguardo a presunti comportamenti scorretti. Ha inoltre aggiunto che AWS collabora con i propri clienti per comprendere i problemi segnalati.

La rappresentante di Perplexity AI, Sara Platnick, ha affermato che i bot dell'azienda non accedono ai siti Web in un modo che va contro i termini di utilizzo di AWS. WIRED ha pubblicato un rapporto investigativo all'inizio di questo mese affermando di aver alimentato i titoli del modello AI Perplexity dal suo sito di notizie insieme a suggerimenti su argomenti specifici. I risultati hanno mostrato storie strettamente parafrasate, comprese false affermazioni attribuite a WIRED.   

Numerose pubblicazioni hanno accusato l'unicorno AI di raschiare contenuti

Forbes ha anche mosso accuse contro Perplexity, affermando che sta plagiando attraverso una nuova funzionalità chiamata Perplexity Pages. La pubblicazione afferma che le pagine curate da Perplexity sulla sua piattaforma mostrano contenuti simili ai post originali di organi di informazione come Bloomberg e CNBC. 

La preoccupazione è che Perplexity abbia guadagnato un nome per aver attribuito correttamente i contenuti ai suoi creatori. Forbes sostiene che i post che hanno ricevuto migliaia di visualizzazioni non menzionano gli editori originali nel testo. Ha detto che Perplexity attribuisce ai creatori solo piccoli loghi per collegamenti facili da perdere.

Leggi anche: OpenAI e Microsoft hanno fatto causa per violazione del copyright

L'Associated Press ha anche riferito che Perplexity ha inventato citazioni false e le ha attribuite a persone reali, il che è preoccupante. Perplexity ha attirato l’attenzione degli investitori tecnologici ed è stata recentemente valutata 3 miliardi di dollari. 

La startup ha raccolto oltre 100 milioni di dollari da investitori come il fondatore di Amazon Jeff Bezos, il capo scienziato di Meta Yann LeCun e il capo scienziato di Google Jeff Dean. Recentemente anche la giapponese SoftBank si è impegnata a investire dai 10 ai 20 milioni di dollari nella startup.

Il CEO di Perplexity, Aravind Srinivas, ha affermato che la domanda sollevata da WIRED riflette un "malinteso profondo e fondamentale" su come Perplexity svolge le sue operazioni. Ha affermato che l'indirizzo IP trovato dalla pubblicazione durante lo scraping dei contenuti è gestito da una terza parte che fornisce servizi di scansione e indicizzazione del web.

Reportage criptopolita di Aamir Sheikh