Menurut ProofNews, banyak perusahaan teknologi terkemuka dunia, termasuk Apple, Nvidia dan Salesforce, dituduh menggunakan data dari Youtube secara ilegal untuk melatih AI.

Secara khusus, kelompok riset AI nirlaba EleutherAI telah mengumpulkan subtitle dari ratusan ribu video Youtube untuk membangun kumpulan data "besar" yang disebut Pile. Tindakan ini dianggap sebagai pelanggaran serius terhadap persyaratan layanan YouTube.

Diketahui Pile berisi subtitle lebih dari 173.000 video dari lebih dari 48.000 saluran Youtube, termasuk video yang dihapus. Kumpulan data ini kemudian digunakan oleh banyak perusahaan teknologi besar untuk melatih model AI, mulai dari chatbot hingga mesin pemrosesan bahasa alami.

Meskipun beberapa perusahaan seperti Anthropic dan Salesforce mengakui menggunakan Pile, mereka berpendapat bahwa itu adalah kumpulan data yang “tersedia untuk umum” dan menyangkal segala tuduhan pelanggaran hak cipta. Namun, ProofNews mengatakan daftar perusahaan yang menggunakan Pile mungkin lebih panjang lagi, karena banyak unit tidak mengungkapkan secara publik sumber data pelatihan AI mereka.

Perlu dicatat bahwa Pile tidak hanya berisi konten dari saluran Youtube biasa, tetapi juga mencakup video dari saluran cryptocurrency terkenal seperti Coinbase, Cointelegraph, dan Majalah Bitcoin.

Kejadian ini kembali menimbulkan kekhawatiran mengenai masalah hak cipta data di bidang AI. Pakar hukum meyakini perselisihan terkait penggunaan data YouTube untuk tujuan komersial akan meningkat, terutama dalam konteks perlombaan mengembangkan AI. 

ProofNews mengatakan bahwa OpenAI dan Google juga telah mengumpulkan teks YouTube di masa lalu. Meskipun Google, perusahaan pemilik YouTube, menegaskan bahwa tindakannya berada dalam kerangka perjanjian dengan pengguna, OpenAI tidak membenarkan atau membantah laporan di atas.

Hingga saat ini, firma hukum Baker Hoestler mencantumkan setidaknya lima belas tuntutan hukum terkait perusahaan teknologi seperti: Anthropic, Meta, GitHub, Stability AI, Nvidia dan Google. Secara khusus, OpenAI menghadapi tuntutan hukum besar dari perusahaan induk Mother Jones dan The New York Times. Secara umum, situasi hukum hak cipta data di bidang AI semakin tegang dengan perkembangan yang kompleks dan tidak dapat diprediksi.

Ikuti Berita 24 jam agar tidak ketinggalan perkembangan blockchain terbaru di Forum Popularisasi Blockchain.