Oficialii Amazon au spus că divizia de cloud a companiei investighează afirmațiile conform cărora startup-ul AI Perplexity scoate conținut de pe site-uri web fără nicio aprobare. Evoluția a venit după ce mai multe instituții de știri au acuzat Perplexity de extragerea ilegală de conținut.

Perplexity AI ignoră standardul web numit Robots Exclusion Protocol. Protocolul este cunoscut în mod obișnuit ca robots.txt, conform căruia site-urile web definesc ce pagini pot accesa motoarele de căutare, AI și alte crawler-uri, potrivit unui raport realizat de WIRED. Forbes a acuzat, de asemenea, startup-ul AI că a plagiat munca jurnaliştilor.

Citește și: SoftBank investește în alternativa Google Perplexity AI la o evaluare de 3 miliarde USD

Respectarea robots.txt este obligatorie pentru site-urile care utilizează găzduiri sau servere Amazon Web Services (AWS). În timp ce majoritatea site-urilor web respectă standardul, legea nu obligă pe nimeni să respecte protocolul.

Se presupune că perplexitatea încalcă standardele web

Purtătorul de cuvânt al Amazon, Samantha Mayowa, a declarat vineri că firma evaluează informațiile despre încălcarea protocolului de către Perplexity. Un canal de știri, WIRED, a acuzat-o pe Perplexity că a îndepărtat conținut de pe site-urile de știri care interzic astfel de practici. Este important să rețineți că Perplexity folosește AWS pentru nevoile sale de server.

Mayowa a spus într-o declarație că, 

„Termenii și condițiile [Amazon] interzic activitățile abuzive și ilegale, iar clienții noștri sunt responsabili pentru respectarea acelor termeni”, Sursa: AP.

Purtătorul de cuvânt a spus că compania primește în mod obișnuit plângeri din diverse surse cu privire la presupuse abateri. Ea a adăugat, de asemenea, că AWS interacționează cu clienții săi pentru a înțelege problemele raportate.

Reprezentantul Perplexity AI, Sara Platnick, a spus că roboții companiei nu accesează site-urile într-un mod care contravine termenilor de utilizare ai AWS. WIRED a publicat un raport de investigație la începutul acestei luni, spunând că a alimentat titlurile modelului Perplexity AI de pe site-ul său de știri, împreună cu solicitări despre subiecte specifice. Rezultatele au arătat povești parafrazate îndeaproape, inclusiv afirmații false atribuite lui WIRED.   

Mai multe publicații l-au acuzat pe unicornul cu inteligență artificială de răzuit conținut

Forbes a făcut, de asemenea, acuzații împotriva Perplexity, spunând că plagiază printr-o nouă funcție numită Perplexity Pages. Publicația a spus că paginile organizate de Perplexity pe platforma sa arată conținut similar cu postările originale ale instituțiilor de știri precum Bloomberg și CNBC. 

Preocuparea este că Perplexity și-a câștigat un nume pentru atribuirea corectă a conținutului creatorilor săi. Forbes susține că postările care au primit mii de vizualizări nu menționează în text editorii originali. S-a spus că Perplexity atribuie creatorilor doar logo-uri mici pentru link-uri care sunt ușor de ratat.

Citește și: OpenAI și Microsoft au dat în judecată pentru încălcarea drepturilor de autor

Associated Press a mai raportat că Perplexity a inventat citate false și le-a atribuit unor oameni reali, ceea ce este îngrijorător. Perplexity a atras atenția investitorilor în tehnologie și a fost evaluată recent la 3 miliarde de dolari. 

Startup-ul a strâns peste 100 de milioane de dolari de la investitori precum fondatorul Amazon Jeff Bezos, cercetătorul șef Meta Yann LeCun, cercetătorul șef Google Jeff Dean. Recent, SoftBank din Japonia s-a angajat să investească între 10 și 20 de milioane de dolari în startup.

CEO-ul Perplexity, Aravind Srinivas, a spus că întrebarea ridicată de WIRED reflectă o „neînțelegere profundă și fundamentală” a modului în care Perplexity își desfășoară operațiunile. El a spus că adresa IP pe care a găsit-o publicația pentru scraping conținut este operată de o terță parte care furnizează servicii de crawling și indexare web.

Reportaj criptopolitan de Aamir Sheikh