The New York Times memaparkan metodologi yang digunakan OpenAI untuk mengumpulkan jutaan jam transkrip video YouTube guna menghasilkan data dalam jumlah besar yang dibutuhkan model AI mereka yang canggih, GPT-4. Meskipun tampaknya perusahaan-perusahaan ini mengikuti jalur yang sama, membentuk antrean yang dipimpin oleh raksasa Google dan Meta, jalur tersebut semakin cepat seiring dengan peningkatan teknologi AI. Semua ini mengarah pada pertanyaan tentang “kesenjangan digital” dan apa dampaknya terhadap kemampuan individu untuk berpartisipasi dalam perekonomian, khususnya dalam isu-isu seperti hak cipta dan etika data.

Taktik akuisisi data OpenAI yang berani

OpenAI melihat dan menganalisis konten YouTube ini. Strategi ini, terlepas dari sifat inovatif dari penggunaan bebas, menyentuh prinsip-prinsip pemanfaatan yang adil, yang merupakan prasyarat bagi perusahaan ini. Merekam video YouTube, salah satu tahapan yang dimiliki oleh Google untuk proses pembelajaran AI memunculkan kekhawatiran atas pelanggaran hak cipta dan masalah etika yang terkait dengan penggunaan data tanpa persetujuan penulis.

Lucunya, setelah Google mendapat kecaman sebagai perusahaan pemilik YouTube karena hal yang sama, mereka diduga melakukan praktik serupa untuk model AI mereka. Proses pengintaian bersama ini jelas merupakan bagian menarik dari laporan ini, yang selanjutnya mengungkap batasan etika dan hukum yang membingungkan dari perusahaan teknologi dalam upaya kecerdasan buatan mereka. Di sisi lain, Google telah menyebutkan bahwa mereka bisa mendapatkan izin pembuatnya untuk menggunakan video sebelum melatih sistem AI pada data tersebut, yang pada akhirnya menjadi bahan perdebatan dalam narasinya.

Revisi kebijakan privasi

Salah satu peristiwa utamanya adalah Google, sebuah langkah perusahaan untuk mengubah kebijakan privasi mereka pada akhir Juni 2023. Strategi tersebut bertujuan untuk memperdalam kemampuan perusahaan dalam memanfaatkan sumber data yang dapat diakses publik, mulai dari dokumen Google hingga Google Maps. ulasan, untuk memperkuat inovasi yang dipimpin AI. Hal ini menunjukkan fenomena sektor teknologi yang lebih luas di mana perusahaan-perusahaan Teknologi Besar ini memberikan kepemimpinan dalam bidang inovasi dan privasi pengguna saat mereka berjuang untuk mencapai keseimbangan yang tepat dari keduanya.

Kini, pengungkapan OpenAI dan Google mengenai praktik pengumpulan data tanpa persetujuan eksplisit oleh raksasa teknologi inilah yang menimbulkan pertanyaan mengenai arah pertumbuhan AI dan penggunaan data secara etis. Neil Mohan, CEO YouTube, dikutip oleh Bloomberg mengenai topik ini, dan dia mengatakan platform tersebut tidak mengizinkan pengunduhan dari sumber yang tidak sah ini.

Implikasi industri dan hukum

Pertanyaan mengenai moralitas dan legalitas upaya pengikisan data ini kemudian muncul karena adanya ambiguitas. Hal lain yang perlu diperbaiki adalah masalah plagiarisme, karena pendekatan ini mungkin kreatif namun juga memicu masalah hak cipta. Masalah privasi juga menjadi perhatian dalam industri ini. Namun, jangkauan bug ini tidak hanya terbatas pada masalah hukum dan etika saja, namun lebih dari itu. Melihat banyaknya hal tersebut, mereka menarik perhatian pada perlombaan teknologi yang lebih signifikan (teknologi AI), yang bertujuan menggunakan data untuk mendukung kemajuan AI.

Ketika pionir teknologi AI seperti OpenAI dan Google cenderung memajukan cakupan paradigma AI berikutnya, perdebatan mengenai jumlah data yang dapat digunakan, apa saja pertimbangan perlindungan hak cipta, dan dampak sosial yang besar dari penerapan AI semakin meluas. Menggabungkan inovasi dengan etika akan menghasilkan gambaran yang lebih kompleks, sehingga memerlukan pengembangan prinsip-prinsip regulasi dan kebijakan yang jelas.

Cara kerja OpenAI dan Google dalam mengambil video YouTube untuk tujuan pelatihan memunculkan persoalan multidimensi yang bersifat subjektif yang terdiri dari dimensi hukum, etika, dan teknologi. Oleh karena itu, sektor teknologi selalu menghadapi tantangan seperti inovasi, privasi, dan etika, yang tanpanya pertumbuhan yang berkelanjutan tidak dapat terjamin. Pembahasan mengenai permasalahan ini akan terus berlanjut. Namun, hal ini juga akan meluas ke setiap pemangku kepentingan di masyarakat, mulai dari pakar hukum hingga pengembang AI sendiri, untuk akhirnya menghasilkan usulan solusi.

Kisah Asli Dari https://www.neowin.net/news/google-reportedly-let-openai-transcribe-a-million-hours-of-youtube-videos-to-train-gpt-4/