New York Times, OpenAI'nin güçlü yapay zeka modeli GPT-4 için gereken geniş verileri üretmek amacıyla milyonlarca saatlik YouTube video transkriptini toplamak için kullandığı metodolojiyi açığa çıkarıyor. Bu şirketler Google ve Meta gibi devlerin öncülüğünde bir kuyruk oluşturarak aynı yolu izliyor gibi görünse de, yapay zeka teknolojileri geliştikçe bu rota hız kazanıyor. Tüm bunlar, "dijital uçurum" sorusuna ve bunun, özellikle telif hakkı ve veri etiği gibi konularda, bireyin ekonomiye katılım kapasitesi üzerinde ne gibi bir etkiye sahip olduğu sorusuna yol açıyor.

OpenAI'nin cesur veri toplama taktikleri

OpenAI bu YouTube içeriğini tespit etti ve analiz etti. Bu strateji, serbest etekli kullanımın yenilikçi doğasına rağmen, bu şirketin imkânının ön koşulu olan adil kullanım ilkelerine değiniyor. Yapay zeka öğrenme süreci için Google'ın sahip olduğu aşamalardan biri olan YouTube videolarının kaydedilmesi, telif hakkı ihlali ve yazarın izni olmadan veri kullanımıyla ilgili etik sorunlar konusundaki endişeleri gündeme getiriyor.

Yeterince komik, YouTube'un da sahibi olan şirket olarak Google'ın eleştirilere maruz kalmasından sonra, yapay zeka modelleri için bu tür uygulamalara giriştikleri iddia edildi. Bu ortak gözetleme süreci, raporun açıkça süslü bir kısmıdır ve teknoloji şirketlerinin yapay zeka çabalarındaki kafa karıştırıcı etik ve yasal sınırlarını daha da ortaya koymaktadır. Öte yandan Google, bir yapay zeka sistemini bu veriler üzerinde eğitmeden önce videoların kullanımı için içerik oluşturucunun iznini alabileceklerini ve sonuçta anlatıda bir tartışma konusu olabileceğini belirtti.

Gizlilik politikası revizyonu

Bunun ana olaylarından biri, Haziran 2023'ün sonuna kadar gizlilik politikasını değiştirmeye yönelik kurumsal bir önlem olan Google'dı. Bu nedenle strateji, şirketin Google dokümanlarından Google Haritalar'a kadar herkesin erişebileceği veri kaynaklarından yararlanma yeteneklerini derinleştirmeyi amaçlıyordu. AI liderliğindeki yeniliği güçlendirmek için incelemeler. Bu, Büyük Teknoloji şirketlerinin hem inovasyon hem de kullanıcı gizliliği alanlarında liderlik üstlendiği, her ikisinin de doğru dengesini bulmaya çabaladıkları daha geniş bir teknoloji sektörü fenomenine işaret ediyor.

OpenAI ve Google'ın açık izin olmadan veri toplama uygulamalarını açığa vurması artık bu teknoloji devleriyle birlikte, yapay zeka büyümesinin gidişatı ve verilerin etik kullanımına ilişkin soruları gündeme getiriyor. YouTube CEO'su Neil Mohan, Bloomberg'in bu konuyla ilgili sözlerini aktardı ve platformun bu yetkisiz kaynakların indirilmesine izin vermediğini söyledi.

Endüstri ve yasal sonuçlar

Bu veri kazıma çabalarının ahlakı ve yasallığı sorusu belirsizlik nedeniyle gündeme geliyor. Geliştirilmesi gereken bir diğer alan ise intihal sorunlarıdır; çünkü bu yaklaşımlar yaratıcı olabilir ancak aynı zamanda telif hakkı sorunlarını da tetikleyebilir. Gizlilik sorunları da bu sektörde bir endişe kaynağıdır. Ancak bu hataların kapsamı sadece yasal ve etik sorunlarla sınırlı değil, bunun çok ötesine geçiyor. Bolluktan, yapay zeka ilerlemelerini güçlendirmek için verileri kullanmayı amaçlayan daha önemli bir teknoloji (AI teknolojisi) yarışına dikkat çekiyorlar.

OpenAI ve Google gibi yapay zeka teknolojisinin öncüleri bir sonraki yapay zeka paradigmasının kapsamını ilerletmeye yöneldikçe, hangi miktarda verinin kullanılabileceği, telif hakkı korumasına ilişkin hususların neler olduğu ve yapay zeka uygulamalarının büyük toplumsal etkileri hakkındaki tartışmalar genişliyor. İnovasyonu etikle karıştırmak, düzenleme ilkelerinin ve açık politikaların geliştirilmesini gerektiren daha karmaşık bir tabloya yol açmaktadır.

OpenAI ve Google'ın YouTube videolarını eğitim amaçlı çekme konusundaki çalışmaları, hukuki, etik ve teknolojik boyutlardan oluşan çok boyutlu subjektif bir meseleyi ortaya çıkarmaktadır. Bu nedenle teknoloji sektörü sürekli olarak inovasyon, gizlilik ve etik gibi zorluklarla karşı karşıyadır ve bunlar olmadan büyümenin devam etmesi garanti edilemez. Bu konulara ilişkin tartışmalar devam edecek. Yine de bu, hukuk uzmanlarından yapay zeka geliştiricilerine kadar toplumdaki her paydaşı kapsayacak ve sonunda önerilen bir çözüme ulaşacak.

Orijinal Hikaye https://www.neowin.net/news/google-reportedly-let-openai-transcribe-a-million-hours-of-youtube-videos-to-train-gpt-4/'den