OpenAI un Microsoft saskaras ar jaunu tiesas procesu no Izmeklēšanas ziņošanas centra (CIR). CIR saka, ka OpenAI ir izmantojis savu publicēto saturu no Mother Jones un Reveal vietnēm, lai apmācītu iepriekšējās ChatGPT versijas.

Lasiet arī: OpenAI pārtrauc ChatGPT balsi pēc Skārletas Johansones strīda 

CIR, prasītājs saka, ka OpenAI izmantoja tā saturu bez atļaujas vai kompensācijas solījuma. CIR, kas dibināta 1977. gadā, pārvalda bezpeļņas amerikāņu žurnālu Mother Jones and Reveal aplāde. 

CIR iesūdz OpenAI un Microsoft par autortiesību pārkāpumiem 

Izmeklēšanas ziņošanas centrs (CIR) ceturtdien iesniedza prasību federālajā tiesā Ņujorkā. Bezpeļņas organizācija apsūdzēja OpenAI un Microsoft to satura izmantošanā bez atļaujas vai kompensācijas. CIR saka, ka OpenAI ir pārkāpis autortiesību likumus, izmantojot tā saturu, lai apmācītu ChatGPT.

CIR izpilddirektore Monika Bauerleina sacīja: “Šī brīvbraucēja rīcība ir ne tikai negodīga, bet arī autortiesību pārkāpums. Žurnālistu darbs CIR un visur ir vērtīgs, un OpenAI un Microsoft to zina.

🚨[AI autortiesību prāva] Izmeklēšanas ziņošanas centrs (aiz @MotherJones & @reveal) iesūdz OpenAI un Microsoft par autortiesību pārkāpumiem. Citāti:

"Apsūdzētie kopēja, izmantoja, saīsināja un rādīja CIR vērtīgo saturu bez CIR atļaujas vai atļaujas, un… pic.twitter.com/SeZ0VtDOMY

— Luiza Jarovsky (@LuizaJarovsky) 2024. gada 29. jūnijs

Oficiālajā sūdzībā prasītājs nolīga datu zinātnieku, lai viņš analizētu OpenWebText datubāzi. OpenWebText ir WebText tuvinājums, kas ir OpenAI izveidots nokasītu tīmekļa lapu korpuss. Datu zinātnieks atklāja, ka datu kopā ir 17 434 vietrāži URL no Mother Jones un 415 no Reveal. Vietnē OpenWebText un WebText ir nedaudz atšķirīgs Mother Jones rakstu skaits, jo nokasīšanas process notika dažādās dienās.

Prasītājs oficiālajā sūdzībā norādīja,

“Kad viņi aizpildīja savus mācību komplektus ar žurnālistikas darbiem, atbildētājiem bija izvēle: cienīt žurnālistikas darbus vai nē. Atbildētāji izvēlējās pēdējo”

Lasiet arī: OpenAI galvenais zinātnieks Iļja Suckevers atvadās

OpenAI izmantoja divus algoritmus, Dragnet un Newspaper, lai izveidotu WebText datubāzi. Dragnet ir paredzēts, lai atdalītu galveno raksta saturu no citām vietnes daļām, piemēram, galvenes, kājenes, nosaukuma, autora vārda un autortiesību paziņojumiem. Kad OpenAI iznīcināja mātes Džounsas vietni, tā noņēma visu savā kājenē un galvenē. Turklāt ChatGPT veidotājs noņēma autortiesību paziņojumu un informāciju par lietošanas noteikumiem saskaņā ar sūdzību. 

Turklāt prasītājs apgalvo, ka Microsoft zināja, ka izkoptajos URL bija žurnālistikas saturs bez autoru vārdiem, nosaukumiem un autortiesību paziņojumiem, tādējādi veicinot Bing AI un ChatGPT autortiesību pārkāpumus.

CIR pieprasa peļņu no OpenAI un Microsoft, kā arī faktiskos vai likumā noteiktos zaudējumus. Norādītā summa ir vismaz 750 ASV dolāri par katru pārkāpto darbu un 2500 ASV dolāri par DMCA pārkāpumu.

OpenAI saskaras ar tiesas prāvām no citām publikācijām

Šī nav pirmā tiesas prāva, kas iesniegta pret OpenAI par autortiesību pārkāpumiem. Kopš ChatGPT izlaišanas 2022. gada beigās, OpenAI un Microsoft ir saskārušies ar daudzām tiesas prāvām no tādiem lieliem uzņēmumiem kā New York Times, The Intercept, New York Daily News un Chicago Tribune.

Lasiet arī: Darbinieki apgalvo, ka OpenAI un Google DeepMind slēpj AI riskus

Tikmēr daži lielākie izdevēji un interneta giganti ir parakstījuši licences līgumus ar OpenAI, dodot tai piekļuvi saviem arhīviem. Tajos ietilpst žurnāls TIME, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow un Reddit.

Randas Moses kriptopolītisks ziņojums