Trích dẫn vi phạm bản quyền, tổ chức BREIN có trụ sở tại Hà Lan đã thành công trong việc gỡ bỏ một tập dữ liệu ngôn ngữ lớn đang được sử dụng để đào tạo AI.

Trong một tuyên bố được đưa ra vào thứ Ba, BREIN giải thích rằng tập dữ liệu bao gồm 10.000 cuốn sách, bài báo và phụ đề tiếng Hà Lan cho phim và phim truyền hình được lấy mà không được phép.

Đạo luật AI của EU nhằm mục đích điều chỉnh các nguồn dữ liệu đào tạo

Theo giám đốc Bastiaan van Ramshorst, hiện vẫn chưa rõ các công ty AI có thể sử dụng bao nhiêu bộ dữ liệu. "Rất khó để biết, nhưng chúng tôi đang cố gắng đúng hạn" để tránh các vụ kiện tụng trong tương lai, ông nói.

Đạo luật AI mới được Liên minh châu Âu đề xuất cũng sẽ yêu cầu các công ty AI cung cấp quyền truy cập vào tập dữ liệu và nguồn dữ liệu được sử dụng để đào tạo các mô hình AI. Các cuộc chiến pháp lý liên quan khác vẫn đang diễn ra tại Hoa Kỳ. Ví dụ, OpenAI do Microsoft hậu thuẫn thường xuyên tham gia vào nhiều vấn đề pháp lý khác nhau, như vụ việc gần đây với tờ New York Times.

Microsoft được cho là đã sao chép các tác phẩm báo chí đã đăng ký của nguyên đơn ngoài các tác phẩm báo chí có bản quyền khác. Về vấn đề vi phạm tiềm ẩn, CEO của công ty đã được trích dẫn rằng công ty có dữ liệu này.

Các cáo buộc cho thấy Microsoft đã sử dụng các tài liệu có bản quyền này trong các sản phẩm AI, bao gồm ChatGPT và Copilot, mà không xin giấy phép. Khiếu nại đặc biệt cáo buộc Microsoft đã xóa thông tin quan trọng khỏi các tác phẩm này. Chẳng hạn như tên tác giả, tiêu đề tác phẩm, hình mờ 'bản quyền' và các hạn chế khác.

Ở Đan Mạch, các biện pháp chống vi phạm bản quyền cũng đã mang lại kết quả đáng kể trong cuộc chiến chống vi phạm bản quyền. Năm ngoái, một nhóm bảo vệ bản quyền có trụ sở tại Đan Mạch, Danish Rights Alliance, đã yêu cầu và đã gỡ bỏ tập dữ liệu “Books3” khỏi Internet.

Nhà cung cấp bộ dữ liệu tuân thủ lệnh của tòa án, xóa nội dung

Người cung cấp tập dữ liệu của Hà Lan đã tuân thủ lệnh của tòa án do BREIN đưa ra. Thỏa thuận này dẫn đến việc tập dữ liệu bị xóa khỏi trang web trước đó đã cung cấp tập dữ liệu để tải xuống. BREIN từ chối tiết lộ danh tính của một người liên quan đến vụ việc này vì luật bảo mật của Hà Lan.

Việc xóa bộ dữ liệu này cho thấy các nhóm thực thi bản quyền vẫn tiếp tục đấu tranh để bảo vệ quyền sở hữu trí tuệ trong thế giới kỹ thuật số. Để giải quyết vấn đề thu thập hàng loạt tài liệu có bản quyền, BREIN khuyến nghị chủ sở hữu quyền sử dụng quyền bảo lưu theo quy định của Đạo luật Bản quyền (Điều 15o.1).