Potrivit ProofNews, multe dintre cele mai importante corporații tehnologice din lume, inclusiv Apple, Nvidia și Salesforce, sunt acuzate că folosesc ilegal date de pe Youtube pentru a antrena AI.

Mai exact, grupul non-profit de cercetare AI EleutherAI a colectat subtitrări din sute de mii de videoclipuri YouTube pentru a construi un set de date „uriaș” numit Pile. Această acțiune este considerată o încălcare gravă a termenilor și condițiilor YouTube.

Se știe că Pile conține subtitrări a peste 173.000 de videoclipuri de pe peste 48.000 de canale Youtube, inclusiv videoclipurile șterse. Acest set de date este apoi folosit de multe companii mari de tehnologie pentru a antrena modele AI, de la chatbot la motoarele de procesare a limbajului natural.

Deși unele companii precum Anthropic și Salesforce recunosc că folosesc Pile, ele susțin că este un set de date „disponibil public” și neagă orice acuzație de încălcare a drepturilor de autor. Cu toate acestea, ProofNews a spus că lista companiilor care folosesc Pile poate fi și mai lungă, deoarece multe unități nu dezvăluie public sursa datelor lor de instruire AI.

Este demn de remarcat faptul că Pile nu numai că conține conținut de pe canalele obișnuite de Youtube, dar include și videoclipuri de la canale de criptomonede celebre precum Coinbase, Cointelegraph și Bitcoin Magazine.

Acest incident ridică încă o dată îngrijorări cu privire la problemele legate de drepturile de autor asupra datelor în domeniul AI. Experții juridici consideră că disputele legate de utilizarea datelor YouTube în scopuri comerciale vor crește, mai ales în contextul cursei pentru dezvoltarea IA. 

ProofNews a spus că OpenAI și Google au colectat și text YouTube în trecut. În timp ce Google, compania care deține YouTube, a afirmat că acțiunile sale au fost în cadrul acordului său cu utilizatorii, OpenAI nu a confirmat și nici nu a infirmat raportul de mai sus.

Până în prezent, firma de avocatură Baker Hoestler listează cel puțin cincisprezece procese legate de companii de tehnologie precum: Anthropic, Meta, GitHub, Stability AI, Nvidia și Google. În special, OpenAI se confruntă cu procese majore din partea companiei-mamă a Mother Jones și The New York Times. În general, situația juridică privind drepturile de autor asupra datelor în domeniul AI devine din ce în ce mai tensionată cu evoluții complexe și imprevizibile.

Urmăriți 24h News pentru a nu rata cele mai recente evoluții blockchain de la Forumul de popularizare Blockchain.