Il New York Times espone la metodologia utilizzata da OpenAI per accumulare milioni di ore di trascrizioni di video di YouTube per generare i vasti dati richiesti dal loro potente modello di intelligenza artificiale GPT-4. Anche se può sembrare che queste aziende stiano seguendo lo stesso percorso, formando una coda guidata dai giganti Google e Meta, il percorso sta guadagnando terreno man mano che le tecnologie AI vengono aggiornate. Tutto ciò porta alla questione del “divario digitale” e al suo impatto sulla capacità dell’individuo di partecipare all’economia, in particolare su questioni come il diritto d’autore e l’etica dei dati.

Le audaci tattiche di acquisizione dati di OpenAI

OpenAI ha individuato e analizzato questo contenuto di YouTube. Questa strategia, nonostante la natura innovativa dell'uso a gonna libera, tocca i principi dell'utilizzo corretto, che è la precondizione di possibilità per questa azienda. La registrazione di video su YouTube, una delle fasi di proprietà di Google per il processo di apprendimento dell'intelligenza artificiale, mette in gioco le preoccupazioni sulla violazione del copyright e le questioni etiche legate all'utilizzo dei dati senza il consenso dell'autore.

Abbastanza divertente, dopo che Google è stata criticata come società proprietaria di YouTube per la stessa cosa, presumibilmente si è impegnata in tali pratiche per i loro modelli di intelligenza artificiale. Questo processo di snooping condiviso è chiaramente una parte interessante del rapporto, che rivela ulteriormente i confusi confini etici e legali delle aziende tecnologiche nei loro sforzi di intelligenza artificiale. D'altra parte, Google ha affermato che può ottenere il permesso del creatore per utilizzare i video prima di addestrare un sistema di intelligenza artificiale su tali dati, diventando alla fine un punto di contesa nella narrazione.

La revisione della politica sulla privacy

Uno degli eventi principali è stata la decisione di Google di modificare la propria politica sulla privacy entro la fine di giugno 2023. La strategia mirava quindi ad approfondire le capacità dell'azienda di trarre vantaggio da fonti di dati accessibili al pubblico, dai documenti di Google a Google Maps. revisioni, per rafforzare l’innovazione guidata dall’intelligenza artificiale. Ciò indica un fenomeno più ampio nel settore tecnologico in cui queste grandi aziende tecnologiche esprimono leadership sia nel campo dell’innovazione che in quello della privacy degli utenti mentre lottano per trovare il giusto equilibrio tra entrambi.

È ora con questi giganti della tecnologia che la rivelazione di OpenAI e Google sulle loro pratiche di raccolta di dati senza consenso esplicito solleva interrogativi sul corso della crescita dell’IA e sull’uso etico dei dati. Neil Mohan, CEO di YouTube, è stato citato da Bloomberg su questo argomento e ha affermato che la piattaforma non consente il download di queste fonti non autorizzate.

Industria e implicazioni legali

La questione della moralità e della legalità di questi tentativi di raschiatura dei dati viene quindi sollevata a causa dell’ambiguità. Un’altra area di miglioramento riguarda i problemi di plagio, poiché questi approcci possono essere creativi ma anche innescare problemi di copyright. Anche i problemi di privacy sono una preoccupazione in questo settore. Tuttavia, la portata di questi bug non si limita solo ai problemi legali ed etici, ma va ben oltre. Dall’abbondanza, richiamano l’attenzione su una corsa tecnologica più significativa (tecnologia AI), che mira a utilizzare i dati per potenziare i progressi dell’IA.

Mentre i pionieri della tecnologia AI come OpenAI e Google tendono a far avanzare la portata del prossimo paradigma di AI, il dibattito su quali quantità di dati possono essere utilizzate, quali sono le considerazioni per la protezione del copyright e le enormi implicazioni sociali delle applicazioni di AI si ampliano. Mescolare innovazione ed etica porta a un quadro più complesso, che richiede lo sviluppo di principi di regolamentazione e politiche chiare.

Il funzionamento di OpenAI e Google nel realizzare video di YouTube a fini di formazione dà origine alla questione multidimensionale della natura soggettiva che consiste in dimensioni legali, etiche e tecnologiche. Pertanto, il settore tecnologico è costantemente confrontato a sfide come l’innovazione, la privacy e l’etica, senza le quali non è possibile garantire una crescita continua. La discussione su questi temi continuerà. Tuttavia, si estenderà anche a tutte le parti interessate della società, dagli specialisti legali agli stessi sviluppatori di intelligenza artificiale, per elaborare infine una soluzione proposta.

Storia originale da https://www.neowin.net/news/google-reportedly-let-openai-transcribe-a-million-hours-of-youtube-videos-to-train-gpt-4/