據 ProofNews 報道,包括蘋果、英偉達和 Salesforce 在內的許多全球領先科技公司都被指控非法使用 Youtube 的數據來訓練人工智能。

具體來說,非營利性人工智能研究小組 EleutherAI 從數十萬個 Youtube 視頻中收集了字幕,構建了一個名爲 Pile 的“龐大”數據集。此行爲被視爲嚴重違反 YouTube 的服務條款。

據瞭解,Pile 包含來自 48,000 多個 Youtube 頻道的 173,000 多個視頻的字幕,其中包括已刪除的視頻。然後,許多大型科技公司使用該數據集來訓練從聊天機器人到自然語言處理引擎的人工智能模型。

儘管Anthropic和Salesforce等一些公司承認使用了Pile,但他們辯稱這是一個“公共”數據集,並否認任何侵犯版權的指控。不過,ProofNews 表示,使用 Pile 的公司名單可能會更長,因爲許多單位並沒有公開披露其 AI 訓練數據的來源。

值得注意的是,Pile 不僅包含來自常規 Youtube 頻道的內容,還包含來自 Coinbase、Cointelegraph 和 Bitcoin Magazine 等著名加密貨幣頻道的視頻。

此次事件再次引發人們對人工智能領域數據版權問題的擔憂。法律專家認爲,與將 YouTube 數據用於商業目的相關的爭議將會增加,特別是在人工智能開發競賽的背景下。 

ProofNews 表示,OpenAI 和谷歌過去也收集過 YouTube 文本。雖然擁有 YouTube 的公司谷歌確認其行爲是在與用戶協議的框架內,但 OpenAI 既沒有證實也沒有否認上述報道。

截至目前,Baker Hoestler 律師事務所列出了至少 15 起與科技公司相關的訴訟,例如:Anthropic、Meta、GitHub、Stability AI、Nvidia 和 Google。特別是,OpenAI正面臨來自Mother Jones母公司和《紐約時報》的重大訴訟。總體而言,人工智能領域的數據版權法律形勢日趨緊張,且事態發展複雜且難以預測。

關注24小時新聞,不錯過區塊鏈普及論壇上的任何最新區塊鏈動態。