Các quan chức của Amazon cho biết bộ phận đám mây của công ty đang điều tra các cáo buộc rằng công ty khởi nghiệp AI Perplexity đang lấy nội dung từ các trang web mà không có bất kỳ sự chấp thuận nào. Sự phát triển này diễn ra sau khi một số cơ quan báo chí cáo buộc Perplexity trích xuất nội dung một cách bất hợp pháp.

Perplexity AI bị cáo buộc bỏ qua tiêu chuẩn web có tên Giao thức loại trừ robot. Theo báo cáo của WIRED, giao thức này thường được gọi là robots.txt, theo đó các trang web xác định những trang mà công cụ tìm kiếm, AI và các trình thu thập thông tin khác có thể truy cập. Forbes cũng cáo buộc công ty khởi nghiệp AI đạo văn tác phẩm của các nhà báo.

Cũng đọc: SoftBank đầu tư vào AI thay thế Perplexity của Google với mức định giá 3 tỷ USD

Việc tuân thủ robots.txt là bắt buộc đối với các trang web sử dụng máy chủ hoặc máy chủ lưu trữ của Amazon Web Services (AWS). Mặc dù hầu hết các trang web đều tuân theo tiêu chuẩn nhưng luật pháp không bắt buộc bất kỳ ai phải tuân theo giao thức.

Perplexity bị cáo buộc vi phạm tiêu chuẩn web

Người phát ngôn của Amazon, Samantha Mayowa, cho biết hôm thứ Sáu rằng công ty đang đánh giá thông tin về việc Perplexity vi phạm giao thức. Một hãng tin tức, WIRED, đã cáo buộc Perplexity đã lấy nội dung từ các trang tin tức cấm các hành vi như vậy. Điều quan trọng cần nhớ là Perplexity sử dụng AWS cho nhu cầu máy chủ của mình.

Mayowa nói trong một tuyên bố rằng, 

“Điều khoản dịch vụ của [Amazon] nghiêm cấm các hoạt động lạm dụng và bất hợp pháp và khách hàng của chúng tôi có trách nhiệm tuân thủ các điều khoản đó,” Nguồn: AP.

Người phát ngôn cho biết công ty thường xuyên nhận được khiếu nại từ nhiều nguồn khác nhau về cáo buộc hành vi sai trái. Cô cũng nói thêm rằng AWS sẽ tương tác với khách hàng của mình để tìm hiểu các vấn đề được báo cáo.

Đại diện của Perplexity AI, Sara Platnick, cho biết các bot của công ty không truy cập các trang web theo cách trái với điều khoản sử dụng của AWS. WIRED đã xuất bản một báo cáo điều tra vào đầu tháng này nói rằng họ cung cấp các tiêu đề về mô hình Perplexity AI từ trang tin tức của mình cùng với lời nhắc về các chủ đề cụ thể. Kết quả cho thấy những câu chuyện được diễn giải chặt chẽ, bao gồm cả những tuyên bố sai sự thật được cho là của WIRED.   

Nhiều ấn phẩm đã cáo buộc kỳ lân AI cạo nội dung

Forbes cũng đã đưa ra cáo buộc chống lại Perplexity, nói rằng họ đang đạo văn thông qua một tính năng mới có tên là Perplexity Pages. Ấn phẩm cho biết các trang do Perplexity quản lý trên nền tảng của nó hiển thị nội dung tương tự như các bài đăng gốc của các hãng tin tức như Bloomberg và CNBC. 

Điều đáng lo ngại là Perplexity đã nổi tiếng về việc phân bổ nội dung phù hợp cho người tạo ra nó. Forbes tuyên bố rằng những bài đăng nhận được hàng nghìn lượt xem không đề cập đến nhà xuất bản gốc trong văn bản. Nó nói rằng Perplexity chỉ gán cho những người sáng tạo những biểu tượng nhỏ cho những liên kết dễ bỏ sót.

Cũng đọc: OpenAI và Microsoft bị kiện vì vi phạm bản quyền

Associated Press cũng đưa tin rằng Perplexity đã phát minh ra những câu trích dẫn giả và gán chúng cho người thật, điều này thật đáng lo ngại. Perplexity đã thu hút được sự chú ý của các nhà đầu tư công nghệ và gần đây được định giá 3 tỷ USD. 

Công ty khởi nghiệp này đã huy động được hơn 100 triệu USD từ các nhà đầu tư như người sáng lập Amazon Jeff Bezos, nhà khoa học trưởng của Meta Yann LeCun, nhà khoa học trưởng của Google Jeff Dean. Gần đây SoftBank của Nhật Bản cũng cam kết đầu tư 10 đến 20 triệu USD vào startup này.

Giám đốc điều hành của Perplexity Aravind Srinivas nói rằng câu hỏi mà WIRED đưa ra phản ánh “sự hiểu lầm cơ bản và sâu sắc” về cách Perplexity thực hiện các hoạt động của mình. Ông nói rằng địa chỉ IP mà ấn phẩm tìm thấy nội dung thu thập dữ liệu được vận hành bởi một bên thứ ba cung cấp dịch vụ lập chỉ mục và thu thập dữ liệu web.

Báo cáo về tiền điện tử của Aamir Sheikh