Sebuah kelompok advokasi mengungkapkan bahwa pembuat gambar telah menggunakan miliaran gambar anak-anak Brasil untuk melatih model AI mereka tanpa persetujuan mereka. Human Rights Watch (HRW) melakukan penelitian yang menunjukkan pembuat gambar populer seperti Stable Diffusion menggunakan gambar anak-anak “yang mencakup seluruh masa kecil mereka” untuk melatih model mereka.

Baca juga: Perusahaan teknologi didesak untuk memerangi lonjakan materi pelecehan seksual terhadap anak yang dihasilkan oleh AI

Studi HRW mengungkapkan gambar-gambar ini diambil dari sekitar 10 negara bagian Brazil. Dilaporkan bahwa gambar-gambar ini menimbulkan “risiko privasi bagi anak-anak” yang sangat besar karena tindakan tersebut juga meningkatkan produksi gambar-gambar non-konsensual yang mirip dengan mereka.

Miliaran gambar anak-anak Brasil digunakan untuk melatih model AI

Peneliti HRW Hye Jung Han mengungkap masalah ini setelah menganalisis sebagian kecil (kurang dari 0,0001%) LAION-5B, kumpulan data yang dibuat dari cuplikan Common Crawl di web publik. Dia mengungkapkan bahwa kumpulan data tersebut tidak berisi foto sebenarnya, namun berisi “pasangan teks gambar” yang diambil dari hampir 6 miliar gambar dan keterangan yang diposting sejak 2008.

Gambar anak-anak dari 10 negara bagian Brasil ditemukan, sebagian besar berupa foto keluarga yang diunggah di blog parenting dan pribadi. Menurut laporan tersebut, ini adalah gambar-gambar yang tidak mudah ditemukan oleh pengguna internet.

Baca juga: Inggris akan menyatakan pembuatan deepfake yang eksplisit secara seksual sebagai tindakan kriminal

HRW menghapus tautan ke gambar tersebut bekerja sama dengan LAION, organisasi nirlaba Jerman yang membuat kumpulan data tersebut. Masih ada kekhawatiran bahwa kumpulan data tersebut mungkin masih merujuk pada gambar anak-anak dari seluruh dunia karena menghapus tautan saja tidak sepenuhnya menyelesaikan masalah.

“Ini adalah masalah yang lebih besar dan sangat memprihatinkan dan sebagai organisasi sukarelawan, kami akan melakukan bagian kami untuk membantu,” kata juru bicara LAION, Nate Tyler, kepada Ars.

Identitas anak-anak mudah dilacak

Laporan HRW lebih lanjut mengungkapkan bahwa identitas banyak anak-anak Brasil dapat dilacak karena nama dan lokasi mereka digunakan dalam keterangan yang membangun kumpulan data. Hal ini juga menimbulkan kekhawatiran bahwa anak-anak mungkin berisiko menjadi sasaran para pelaku intimidasi, sementara gambar mereka mungkin digunakan untuk konten eksplisit.

“Foto-foto yang ditinjau mencakup keseluruhan masa kanak-kanak,” demikian bunyi bagian dari laporan tersebut.

“Mereka mengabadikan momen-momen intim saat bayi dilahirkan di tangan dokter yang bersarung tangan, anak-anak kecil meniup lilin di kue ulang tahun, atau menari dengan pakaian dalam di rumah…”

HRW.

Namun Han mengungkapkan bahwa “semua versi LAION-5B yang tersedia untuk umum telah dihapus,” sehingga risiko foto anak-anak Brasil digunakan kini lebih kecil.

Menurut HRW, kumpulan data tersebut tidak akan tersedia lagi sampai LAION yakin semua konten yang ditandai telah dihapus. Keputusan ini diambil setelah laporan Universitas Stanford juga “menemukan tautan dalam kumpulan data yang mengarah ke konten ilegal di web publik,” termasuk lebih dari 3.000 dugaan konten pelecehan seksual terhadap anak-anak.

Setidaknya 85 anak perempuan di Brazil juga melaporkan bahwa teman sekelas mereka melecehkan mereka dengan menggunakan AI untuk menghasilkan konten deepfake yang eksplisit secara seksual “berdasarkan foto yang diambil dari konten media sosial mereka.”

Melindungi privasi anak-anak

Menurut Ars, LAION-5B diperkenalkan pada tahun 2022, dilaporkan mereplikasi kumpulan data OpenAI, dan disebut-sebut sebagai “kumpulan data gambar-teks” terbesar yang tersedia secara gratis.

Ketika HRW menghubungi LAION mengenai gambar tersebut, organisasi tersebut menanggapi dengan mengatakan bahwa model AI yang dilatih pada LAION-5B “tidak dapat menghasilkan data anak-anak secara verbatim,” meskipun mereka mengakui adanya risiko privasi dan keamanan.

Organisasi tersebut kemudian mulai menghapus beberapa gambar tetapi juga berpendapat bahwa orang tua dan wali bertanggung jawab atas penghapusan foto pribadi anak-anak dari internet. Han tidak setuju dengan argumen mereka, dengan mengatakan:

“Anak-anak dan orang tua mereka tidak boleh memikul tanggung jawab untuk melindungi anak-anak dari teknologi yang pada dasarnya mustahil untuk dilindungi. Itu bukan salah mereka.”

Dia.

HRW menyerukan intervensi mendesak dari anggota parlemen Brasil untuk melindungi hak-hak anak-anak dari teknologi baru. Undang-undang baru harus diterapkan untuk melarang penghapusan data anak-anak ke dalam model AI, sesuai dengan rekomendasi HRW.

Pelaporan Cryptopolitan oleh Enacy Mapakame