Laikraksts New York Times atklāj OpenAI izmantoto metodoloģiju, lai apkopotu miljoniem stundu YouTube video atšifrējumu, lai ģenerētu milzīgos datus, kas nepieciešami viņu jaudīgajam AI modelim GPT-4. Lai gan var šķist, ka šie uzņēmumi iet vienu un to pašu ceļu, veidojot rindu, ko vada milži Google un Meta, maršruts kļūst arvien lielāks, jo AI tehnoloģijas tiek modernizētas. Tas viss noved pie jautājuma par “digitālo plaisu” un to, kāda ir tās ietekme uz indivīda spēju piedalīties ekonomikā, īpaši tādos jautājumos kā autortiesības un datu ētika.

OpenAI drosmīgā datu iegūšanas taktika

OpenAI pamanīja un analizēja šo YouTube saturu. Šī stratēģija, neskatoties uz brīvās lietošanas inovatīvo raksturu, skar godīgas izmantošanas principus, kas ir šī uzņēmuma iespējamības priekšnoteikums. YouTube videoklipu ierakstīšana, kas ir viens no AI mācību procesa posmiem, kas pieder uzņēmumam Google, rada bažas par autortiesību pārkāpumiem un ētikas problēmām, kas saistītas ar datu izmantošanu bez autora piekrišanas.

Smieklīgi, ka pēc tam, kad uzņēmums Google tika kritizēts kā uzņēmums, kuram pieder YouTube par to pašu, viņi, iespējams, ir iesaistījušies šādā praksē saviem AI modeļiem. Šis kopīgais snopšanas process nepārprotami ir izdomāta ziņojuma daļa, kas vēl vairāk atklāj tehnoloģiju uzņēmumu mulsinošās ētiskās un juridiskās robežas to mākslīgā intelekta centienos. No otras puses, Google ir minējis, ka viņi var saņemt satura veidotāja atļauju izmantot videoklipus pirms AI sistēmas apmācības par šiem datiem, kas galu galā kļūst par strīda punktu stāstījumā.

Privātuma politikas pārskatīšana

Viens no galvenajiem notikumiem šajā procesā bija Google — korporatīvais pasākums, lai līdz 2023. gada jūnija beigām mainītu savu privātuma politiku. Tādējādi stratēģijas mērķis bija padziļināt uzņēmuma spēju gūt peļņu no publiski pieejamiem datu avotiem, sākot no Google dokumentiem līdz Google Maps. pārskati, lai stiprinātu AI vadītas inovācijas. Tas norāda uz plašāku tehnoloģiju sektora fenomenu, kurā šie lielie tehnoloģiju uzņēmumi ieņem vadošo lomu gan inovāciju, gan lietotāju privātuma jomā, cenšoties panākt pareizo līdzsvaru abās jomās.

Tagad ar šiem tehnoloģiju milžiem OpenAI un Google atklājums par datu vākšanas praksi bez skaidras piekrišanas rada jautājumus par AI izaugsmes gaitu un datu ētisku izmantošanu. Bloomberg citēja Nīlu Mohanu, YouTube izpilddirektoru par šo tēmu, un viņš teica, ka platforma neļauj lejupielādēt šos nesankcionētos avotus.

Nozares un juridiskās sekas

Neskaidrības dēļ tiek izvirzīts jautājums par šo datu skrāpēšanas pasākumu morāli un likumību. Vēl viena joma, kas jāuzlabo, ir plaģiāta problēmas, jo šīs pieejas var būt radošas, bet arī izraisīt autortiesību problēmas. Šajā nozarē bažas rada arī privātuma jautājumi. Tomēr šo kļūdu sasniedzamība neaprobežojas tikai ar juridiskām un ētiskām problēmām, bet arī pārsniedz to. No pārpilnības viņi vērš uzmanību uz nozīmīgāku tehnoloģiju (AI tehnoloģiju) sacīksti, kuras mērķis ir izmantot datus, lai veicinātu AI sasniegumus.

Tā kā AI tehnoloģiju pionieri, piemēram, OpenAI un Google, mēdz virzīt uz priekšu nākamās AI paradigmas darbības jomu, paplašinās diskusijas par to, kādu datu apjomu var izmantot, kādi ir autortiesību aizsardzības apsvērumi un AI lietojumprogrammu milzīgā ietekme uz sabiedrību. Inovāciju sajaukšana ar ētiku rada sarežģītāku ainu, kas prasa regulējuma principu un skaidras politikas izstrādi.

OpenAI un Google darbība, izmantojot YouTube videoklipus apmācības nolūkos, rada daudzdimensionālu subjektīva rakstura problēmu, kas sastāv no juridiskām, ētiskām un tehnoloģiskām dimensijām. Tāpēc tehnoloģiju nozare pastāvīgi saskaras ar tādām problēmām kā inovācija, privātums un ētika, bez kurām nevar nodrošināt nepārtrauktu izaugsmi. Diskusija par šiem jautājumiem turpināsies. Tomēr tas attieksies arī uz visām sabiedrības ieinteresētajām pusēm, sākot no juridiskajiem speciālistiem līdz pašiem AI izstrādātājiem, lai galu galā nāktu klajā ar piedāvāto risinājumu.

Sākotnējais stāsts no https://www.neowin.net/news/google-reportedly-let-openai-transcribe-a-million-hours-of-youtube-videos-to-train-gpt-4/