Izmeklēšanas ziņošanas centrs (CIR) ir iesūdzējis tiesā OpenAI un tehnoloģiju gigantu Microsoft par iespējamu autortiesību pārkāpumu. 

Prasībā, kas iesniegta Ņujorkas federālajā tiesā, abi uzņēmumi tiek apsūdzēti CIR publikāciju satura, tostarp Mother Jones un Reveal aplādes, izmantošanā bez atbilstošas ​​atļaujas vai kompensācijas. Tas iezīmē vēl vienu juridisku izaicinājumu OpenAI pēc tā populārā AI modeļa ChatGPT izlaišanas.

Sīkāka informācija par tiesas prāvu

Saskaņā ar sūdzību OpenAI un Microsoft ir izmantojuši lielu daudzumu žurnālistikas satura no CIR, lai apmācītu savus mākslīgā intelekta modeļus, īpaši iepriekšējās ChatGPT versijas. Datu zinātnieka veiktā analīze atklāja, ka OpenWebText datu bāze, ko izmantoja OpenAI, satur vairāk nekā 17 000 vietrāžu URL no Mother Jones un vairāk nekā 400 vietrāžus no Reveal. 

[AI autortiesību prāva] Izmeklēšanas ziņojumu centrs (aiz @MotherJones & @reveal) iesūdz OpenAI un Microsoft par autortiesību pārkāpumiem. Citāti: "Apsūdzētie kopēja, izmantoja, saīsināja un rādīja CIR vērtīgo saturu bez CIR atļaujas vai pilnvarojuma, un… pic.twitter.com/SeZ0VtDOMY

— Luiza Jarovsky (@LuizaJarovsky) 2024. gada 29. jūnijs

Šie skaitļi norāda uz ievērojamu ar autortiesībām aizsargātu materiālu izmantošanu, kas iegūti procesos, kuros, iespējams, tika noņemtas rakstiem galvenes, kājenes un autortiesību paziņojumi, lai koncentrētos tikai uz raksta saturu.

Monika Bauerleina, CIR izpilddirektore, norādīja: "Žurnālistikas izmantošana korporatīvā labuma gūšanai bez taisnīgas atlīdzības grauj mūsu darba pamatus." Prasībā uzsvērts, ka apsūdzētie varēja izvēlēties cienīt žurnālistikas darbus, taču izvēlējās to nedarīt.

Tehnoloģiskās un ētiskās problēmas

Sūdzībā sīkāk aprakstītas OpenAI izmantotās tehnoloģijas, piemēram, Dragnet un Newspaper algoritmi, kas paredzēti galvenā satura izvilkšanai no tīmekļa lapām, vienlaikus, iespējams, izlaižot tādus būtiskus elementus kā autoru vārdus un informāciju par autortiesībām. 

Prasītājs apgalvo, ka šī datu nokasīšanas metode veicināja autortiesību pārkāpumus lielā mērogā, tieši ietekmējot sākotnējā satura veidotāju ieņēmumus un tiesības. Turklāt tiesas prāvā tiek apgalvots, ka Microsoft apzinājās, ka izkoptajiem datiem trūka būtiskas identifikācijas informācijas, tādējādi veicinot pārkāpumu problēmas, kuras tagad apstrīd Bing AI un ChatGPT funkcionalitāte.

Sekas un iepriekšējās juridiskās darbības

Šī tiesas prāva papildina pieaugošo juridisko cīņu sarakstu, ar kurām OpenAI un Microsoft ir saskārušies saistībā ar autortiesību jautājumiem kopš ChatGPT ieviešanas. Citas ievērojamas publikācijas, piemēram, New York Times, The Intercept, New York Daily News un Chicago Tribune, arī ir uzsākušas tiesvedību pret tehnoloģiju vienībām.

Turpretim vairāki ievērojami izdevēji un digitālās platformas ir izvēlējušās slēgt licences līgumus ar OpenAI, ļaujot likumīgi izmantot savus arhīvus. Partnerattiecības ar tādām organizācijām kā TIME Magazine, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow un Reddit izceļ atšķirīgu pieeju AI plašās ar autortiesībām aizsargāto materiālu izmantošanas pārvaldībai.

Izmeklēšanas ziņošanas centrs pieprasa kompensāciju par viņu autortiesībām aizsargāto darbu iespējamu neatļautu izmantošanu, tostarp peļņu, ko OpenAI un Microsoft ieguvuši, izmantojot CIR saturu. Pieprasītie zaudējumi ietver vismaz USD 750 par katru pārkāpto darbu un USD 2500 par katru Digitālās tūkstošgades autortiesību likuma pārkāpumu.

Tiesvedības gaitā šīs lietas iznākums varētu būtiski ietekmēt AI uzņēmumu darbību un publiski pieejamā digitālā satura izmantošanu AI modeļu apmācībā. Tehnoloģiju kopiena un autortiesību īpašnieki ļoti uzmanīgi vēro šīs norises, kuru mērķis ir radīt precedentus AI tehnoloģiju un autortiesību likuma krustojumā.

Ziņa CIR Files New Autortiesību pārkāpumu tiesas prāva pret OpenAI un Microsoft pirmo reizi parādījās vietnē Coinfea.