The New York Times odhaluje metodologii používanou OpenAI pro shromažďování milionů hodin přepisů videí YouTube pro generování rozsáhlých dat požadovaných pro jejich výkonný model AI GPT-4. I když se může zdát, že tyto společnosti jdou stejnou cestou a tvoří frontu vedenou giganty Google a Meta, cesta nabírá na tempu, jak jsou technologie AI upgradovány. To vše vede k otázce „digitální propasti“ a toho, jaký dopad to má na schopnost jednotlivce podílet se na ekonomice, konkrétně na otázky, jako je autorská práva a etika dat.

Odvážná taktika získávání dat OpenAI

OpenAI si všimla a analyzovala tento obsah YouTube. Tato strategie se i přes inovativní povahu free-skirted use dotýká principů spravedlivého využití, které je pro tuto společnost předpokladem možnosti. Nahrávání videí na YouTube, jedna z fází procesu učení AI, kterou vlastní Google, přináší do hry obavy z porušování autorských práv a etických problémů spojených s používáním dat bez souhlasu autora.

Docela legrační je, že poté, co se Google dostal pod palbu jako společnost, která vlastní YouTube za stejnou věc, údajně se zapojili do takových praktik pro své modely AI. Tento sdílený proces snoopingu je zjevně luxusní součástí zprávy, která dále odhaluje matoucí etické a právní hranice technologických společností v jejich úsilí o umělou inteligenci. Na druhou stranu Google zmínil, že mohou získat svolení tvůrce k použití videí, než na těchto datech vycvičí systém umělé inteligence, což se nakonec stane předmětem sporu ve vyprávění.

Revize zásad ochrany osobních údajů

Jednou z hlavních událostí byl Google, podnikové opatření ke změně jejich zásad ochrany osobních údajů do konce června 2023. Strategie tak byla zaměřena na prohloubení schopností společnosti vydělávat na veřejně přístupných zdrojích dat, od dokumentů Google po Google Maps. recenze pro posílení inovací vedených umělou inteligencí. To naznačuje širší fenomén technologického sektoru, kde tyto velké technologické společnosti dýchají vedoucí postavení v oblasti inovací i ochrany soukromí uživatelů, protože se snaží najít správnou rovnováhu obou.

Právě u těchto technologických gigantů nyní odhalení OpenAI a Google o jejich praktikách shromažďování dat bez výslovného souhlasu vyvolává otázky týkající se průběhu růstu AI a etického využívání dat. Neil Mohan, CEO YouTube, byl na toto téma citován agenturou Bloomberg a řekl, že platforma nepovoluje stahování těchto neautorizovaných zdrojů.

Průmysl a právní důsledky

Kvůli nejednoznačnosti je pak nastolena otázka morálky a zákonnosti těchto snah o skartování dat. Další oblastí pro zlepšení jsou problémy s plagiátorstvím, protože tyto přístupy mohou být kreativní, ale také podněcovat problémy s autorským právem. Problémy s ochranou soukromí jsou v tomto odvětví také problémem. Dosah těchto chyb však není omezen pouze na právní a etické problémy, ale jde mnohem dál. Z hojnosti upozorňují na významnější závod technologií (technologie AI), který je zaměřen na využití dat k posílení vylepšení AI.

 Vzhledem k tomu, že průkopníci technologie AI, jako je OpenAI a Google, mají tendenci posouvat rozsah dalšího paradigmatu AI, debata o tom, jaké množství dat lze použít, jaká jsou hlediska ochrany autorských práv a obrovské společenské důsledky aplikací AI se rozšiřují. Kombinace inovací s etikou vede ke složitějšímu obrazu, který vyžaduje vytvoření zásad regulace a jasných politik.

Fungování OpenAI a Google při pořizování videí na YouTube pro účely školení vede k vícerozměrnému problému subjektivní povahy, který se skládá z právních, etických a technologických rozměrů. Technologický sektor proto neustále čelí výzvám, jako jsou inovace, soukromí a etika, bez nichž nelze zajistit další růst. Diskuse o těchto otázkách bude pokračovat. Přesto se také rozšíří na všechny zainteresované strany ve společnosti, od právních specialistů až po samotné vývojáře AI, aby nakonec přišli s navrhovaným řešením.

Původní příběh z https://www.neowin.net/news/google-reportedly-let-openai-transcribe-a-million-hours-of-youtube-videos-to-train-gpt-4/