Aizstāvības grupa atklāja, ka attēlu ģeneratori ir izmantojuši miljardiem Brazīlijas bērnu attēlu, lai apmācītu savus AI modeļus bez viņu piekrišanas. Human Rights Watch (HRW) veica pētījumu, kurā redzams, ka populāri attēlu ģeneratori, piemēram, Stable Diffusion, izmantoja bērnu attēlus “visu viņu bērnību”, lai apmācītu savus modeļus.

Lasiet arī: Tehnoloģiju uzņēmumi mudināja cīnīties ar mākslīgā intelekta radīto materiālu seksuālās vardarbības pret bērniem pieaugumu

HRW pētījums atklāj, ka šie attēli tika uzņemti no aptuveni 10 Brazīlijas štatiem. Tā ziņoja, ka šie attēli rada milzīgu “privātuma risku bērniem”, jo šis akts palielina arī tādu attēlu veidošanu, kas nav saskaņoti un attēlo to līdzību.

Miljardiem Brazīlijas bērnu attēlu tika izmantoti, lai apmācītu AI modeļus

HRW pētnieks Hajs Jungs Hans atklāja problēmu pēc tam, kad bija analizējusi daļu (mazāk nekā 0,0001%) LAION-5B, datu kopas, kas izveidota no publiskā tīmekļa Common Crawl momentuzņēmumiem. Viņa atklāja, ka datu kopā nebija faktisko fotoattēlu, bet tajā bija “attēlu teksta pāri”, kas iegūti no gandrīz 6 miljardiem attēlu un parakstu, kas publicēti kopš 2008. gada.

Tika atrasti bērnu attēli no 10 Brazīlijas štatiem, un lielākā daļa no tiem bija ģimenes attēli, kas augšupielādēti vecāku un personīgos emuāros. Ziņojumā teikts, ka šīs ir bildes, uz kurām interneta lietotāji nav viegli paklupt.

Lasiet arī: Apvienotā Karaliste pasludinās seksuāla rakstura dziļo viltojumu izveidi par noziedzīgu darbību

HRW noņēma saites uz attēliem sadarbībā ar LAION, Vācijas bezpeļņas organizāciju, kas izveidoja datu kopu. Joprojām pastāv bažas, ka datu kopā, iespējams, joprojām ir atsauces uz bērnu attēliem no visas pasaules, jo saišu noņemšana vien problēmu pilnībā neatrisina.

"Tas ir plašāks un ļoti satraucošs jautājums, un kā brīvprātīgo organizācija mēs darīsim visu, lai palīdzētu," Ars sacīja LAION pārstāvis Neits Tailers.

Bērnu identitātes ir viegli izsekojamas

HRW ziņojumā arī atklājās, ka daudzu Brazīlijas bērnu identitāti var izsekot, jo viņu vārdi un atrašanās vieta tika izmantoti parakstos, kas veidoja datu kopu. Tas arī radīja bažas, ka bērni var tikt pakļauti huligānismai, kamēr viņu attēli var tikt izmantoti necenzēta satura veidošanā.

"Pārskatītās fotogrāfijas aptver visu bērnību," teikts ziņojuma daļā.

"Tās iemūžināti intīmi mirkļi, kad mazuļi piedzimst ārstu cimdu rokās, mazi bērni pūš svecītes uz dzimšanas dienas tortes vai dejo apakšveļā mājās..."

HRW.

Tomēr Han atklāja, ka "visas publiski pieejamās LAION-5B versijas tika noņemtas", un tāpēc ir mazāks risks, ka tagad tiks izmantotas Brazīlijas bērnu fotogrāfijas.

Saskaņā ar HRW sniegto informāciju datu kopa vairs nebūs pieejama, kamēr LAION nebūs pārliecināts, ka viss atzīmētais saturs ir noņemts. Šāds lēmums tika pieņemts pēc tam, kad Stenfordas universitātes ziņojumā “datu kopā tika atrastas saites, kas norāda uz nelegālu saturu publiskajā tīmeklī”, tostarp vairāk nekā 3000 aizdomīgu bērnu seksuālas izmantošanas satura gadījumu.

Vismaz 85 meitenes Brazīlijā ir arī ziņojušas par saviem klasesbiedriem, kas viņām uzmācas, izmantojot mākslīgo intelektu, lai radītu seksuāli izteiktu viltotu saturu, “pamatojoties uz fotoattēliem, kas ņemti no viņu sociālo mediju satura”.

Bērnu privātuma aizsardzība

Saskaņā ar Ars teikto, LAION-5B tika ieviests 2022. gadā, lai replicētu OpenAI datu kopu, un tika reklamēts kā lielākā "brīvi pieejamā attēla teksta datu kopa".

Kad HRW sazinājās ar LAION saistībā ar attēliem, organizācija atbildēja, sakot, ka AI modeļi, kas apmācīti ar LAION-5B, "nevarēja burtiski ražot bērnu datus", lai gan viņi atzina privātuma un drošības riskus.

Pēc tam organizācija sāka noņemt dažus attēlus, bet arī uzskatīja, ka vecāki un aizbildņi ir atbildīgi par bērnu personīgo fotoattēlu izņemšanu no interneta. Han nepiekrita viņu argumentam, sakot:

“Bērnus un viņu vecākus nevajadzētu uzņemties atbildību par bērnu aizsardzību pret tehnoloģijām, no kurām būtībā nav iespējams aizsargāt. Tā nav viņu vaina."

Viņš.

HRW aicināja Brazīlijas likumdevējus steidzami iejaukties, lai aizsargātu bērnu tiesības no jaunām tehnoloģijām. Ir jāievieš jauni likumi, lai aizliegtu bērnu datu izņemšanu mākslīgā intelekta modeļos saskaņā ar HRW ieteikumiem.

Enacy Mapakame kriptopolītiskie ziņojumi