荷蘭組織 BREIN 以侵犯版權爲由成功刪除了用於人工智能訓練的大量語言數據集。
BREIN 在週二發佈的聲明中解釋道,該數據集包括未經許可獲得的 10,000 本書籍、新聞文章以及電影和電視劇的荷蘭語字幕。
歐盟人工智能法案旨在規範訓練數據源
據該主管 Bastiaan van Ramshorst 稱,目前尚不清楚該數據集可能被人工智能公司使用到什麼程度。“這很難知道,但我們正在努力按時完成”,以避免將來發生訴訟,他說。
歐盟最近提出的人工智慧法案還將要求人工智慧公司提供對其資料集和用於訓練人工智慧模型的資料來源的存取權限。其他相關的法律鬥爭仍在美國進行。例如,微軟支持的 OpenAI 經常捲入各種法律問題,例如最近與《紐約時報》的法律問題。
據稱,除了其他受版權保護的新聞作品外,微軟還涉嫌複製原告的註冊新聞作品。關於潛在侵權問題,該公司執行長表示,公司擁有這些數據。
指控表明,微軟在未經許可的情況下在人工智慧產品(包括 ChatGPT 和 Copilot)中使用了這些受版權保護的資料。該投訴特別指控微軟從這些作品中刪除重要資訊。例如作者姓名、作品名稱、「版權」浮水印以及其他限制。
在丹麥,反盜版措施在打擊版權侵權方面也取得了實質成果。去年,總部位於丹麥的版權保護組織丹麥權利聯盟要求並從網路上撤下「Books3」資料集。
資料集提供者遵守法院命令,刪除內容
提供荷蘭資料集的人遵守了 BREIN 做出的法院命令。該協議導致該資料集從先前提供資料集下載的網站上刪除。由於荷蘭隱私法,BREIN 拒絕透露涉案人員的身分。
該資料集的刪除表明版權執法團體繼續為保護數位世界的智慧財產權而奮鬥。 為了解決大規模抓取受版權保護的資料的問題,BREIN 建議權利人使用《版權法》(第 15o.1 條)規定的保留。