New York Times expune metodologia utilizată de OpenAI pentru a acumula milioane de ore de transcriere video YouTube pentru a genera datele vaste necesare modelului lor puternic AI GPT-4. Deși poate părea că aceste companii urmează aceeași cale, formând o coadă condusă de giganții Google și Meta, ruta crește pe măsură ce tehnologiile AI sunt actualizate. Toate acestea conduc la întrebarea „decalajului digital” și a impactului pe care îl are asupra capacității individului de a participa la economie, în special în probleme precum drepturile de autor și etica datelor.

Tacticile îndrăznețe de achiziție de date ale OpenAI

OpenAI a observat și a analizat acest conținut YouTube. Această strategie, în ciuda naturii inovatoare a utilizării cu fuste libere, atinge principiile utilizării corecte, care este condiția prealabilă a posibilității pentru această companie. Înregistrarea videoclipurilor YouTube, una dintre etapele deținute de Google pentru procesul de învățare AI, pune în joc preocupările legate de încălcarea drepturilor de autor și problemele etice implicate în utilizarea datelor fără consimțământul autorului.

Destul de amuzant, după ce Google a fost criticat în calitate de companie care deține YouTube pentru același lucru, s-ar fi implicat în astfel de practici pentru modelele lor AI. Acest proces de scrutin comun este în mod clar o parte elegantă a raportului, care dezvăluie în continuare granițele etice și juridice confuze ale companiilor de tehnologie în eforturile lor de inteligență artificială. Pe de altă parte, Google a menționat că poate obține permisiunea creatorului de a folosi videoclipuri înainte de a antrena un sistem AI pe acele date, fiind în cele din urmă un punct de disputa în narațiune.

Revizuirea politicii de confidențialitate

Unul dintre principalele evenimente a fost Google, o măsură corporativă de modificare a politicii de confidențialitate până la sfârșitul lunii iunie 2023. Strategia a vizat astfel aprofundarea abilităților companiei de a valorifica sursele de date accesibile publicului, de la documente Google până la Google Maps. recenzii, pentru consolidarea inovației conduse de AI. Acest lucru indică un fenomen mai larg din sectorul tehnologic în care aceste companii Big Tech respira lider atât în ​​domeniul inovației, cât și al confidențialității utilizatorilor, în timp ce se străduiesc să abordeze echilibrul corect al ambelor.

Acum, cu acești giganți tehnologici, dezvăluirea de către OpenAI și Google a practicilor lor de culegere de date fără consimțământ explicit ridică întrebări cu privire la cursul creșterii AI și la utilizarea etică a datelor. Neil Mohan, CEO-ul YouTube, a fost citat de Bloomberg pe această temă și a spus că platforma nu permite descărcarea acestor surse neautorizate.

Implicații industriale și juridice

Problema moralității și legalității acestor eforturi de răzuire a datelor este apoi ridicată din cauza ambiguității. Un alt domeniu de îmbunătățire constă în problemele de plagiat, deoarece aceste abordări pot fi creative, dar pot declanșa și probleme de drepturi de autor. Problemele de confidențialitate sunt, de asemenea, o preocupare în această industrie. Cu toate acestea, acoperirea acestor erori nu se limitează doar la problemele legale și etice, ci depășește cu mult acest lucru. Din abundență, ei atrag atenția asupra unei curse mai semnificative de tehnologie (tehnologie AI), care are ca scop utilizarea datelor pentru a stimula progresele AI.

 Pe măsură ce pionierii tehnologiei AI, cum ar fi OpenAI și Google, tind să avanseze domeniul de aplicare al următoarei paradigme AI, dezbaterea cu privire la cantitățile de date care pot fi utilizate, care sunt considerațiile pentru protecția drepturilor de autor și implicațiile societale uriașe ale aplicațiilor AI se lărgește. Amestecarea inovației cu etica duce la o imagine mai complexă, necesitând dezvoltarea unor principii de reglementare și politici clare.

Lucrările OpenAI și Google în luarea videoclipurilor YouTube în scopuri de instruire dau naștere la problema multidimensională a naturii subiective care constă în dimensiuni juridice, etice și tehnologice. Prin urmare, sectorul tehnologic se confruntă constant cu provocări precum inovația, confidențialitatea și etica, fără de care creșterea continuă nu poate fi asigurată. Discuția cu privire la aceste probleme va continua. Totuși, se va extinde și asupra tuturor părților interesate din societate, de la specialiști în drept până la dezvoltatorii AI înșiși, pentru a veni în cele din urmă cu o soluție propusă.

Povestea originală de la https://www.neowin.net/news/google-reportedly-let-openai-transcribe-a-million-hours-of-youtube-videos-to-train-gpt-4/