Правозащитная группа обнаружила, что генераторы изображений использовали миллиарды изображений бразильских детей для обучения своих моделей искусственного интеллекта без их согласия. Хьюман Райтс Вотч (HRW) провела исследование, которое показало, что популярные генераторы изображений, такие как Stable Diffusion, использовали изображения детей, «охватывающие все их детство», для обучения своих моделей.

Читайте также: Технологические компании призывают бороться с ростом количества материалов о сексуальном насилии над детьми, созданных с помощью ИИ

Исследование HRW показывает, что эти изображения были сделаны примерно из 10 бразильских штатов. В нем сообщается, что эти фотографии представляют собой огромный «риск конфиденциальности для детей», поскольку этот закон также увеличивает производство без согласия изображений, имеющих их сходство.

Миллиарды изображений бразильских детей используются для обучения моделей искусственного интеллекта

Исследователь HRW Хе Юнг Хан выявил проблему после анализа части (менее 0,0001%) LAION-5B, набора данных, созданного на основе снимков общего сканирования общедоступной сети. Она сообщила, что в наборе данных не было реальных фотографий, но содержались «пары текста изображений», взятые из почти 6 миллиардов изображений и подписей, опубликованных с 2008 года.

Были найдены детские фотографии из 10 штатов Бразилии, большинство из которых представляют собой семейные фотографии, загруженные в родительские и личные блоги. Согласно отчету, это фотографии, на которые интернет-пользователям нелегко наткнуться.

Читайте также: Великобритания объявит создание откровенно сексуальных дипфейков уголовным деянием

HRW удалила ссылки на изображения в сотрудничестве с LAION, немецкой некоммерческой организацией, создавшей набор данных. По-прежнему сохраняются опасения, что набор данных все еще может ссылаться на изображения детей со всего мира, поскольку само по себе удаление ссылок не решает проблему полностью.

«Это более масштабная и очень тревожная проблема, и как волонтерская организация мы сделаем все возможное, чтобы помочь», — сказал Ars представитель LAION Нейт Тайлер.

Личности детей легко отследить

В отчете HRW также говорится, что личности многих бразильских детей можно отследить, поскольку их имена и местонахождение использовались в подписях, из которых был составлен набор данных. Это также вызвало обеспокоенность, что дети могут подвергнуться риску стать жертвами хулиганов, в то время как их изображения могут быть использованы для откровенного контента.

«Рассмотренные фотографии охватывают все детство», — говорится в части отчета.

«На них запечатлены интимные моменты рождения младенцев в руках врачей в перчатках, маленькие дети, задувающие свечи на праздничном торте или танцующие дома в нижнем белье…»

ХРВ.

Однако Хан сообщил, что «все общедоступные версии LAION-5B были удалены», и, следовательно, риск использования фотографий бразильских детей сейчас меньше.

По данным HRW, набор данных не будет снова доступен до тех пор, пока LAION не убедится, что весь помеченный контент удален. Решение было принято после того, как в отчете Стэнфордского университета также «обнаружены ссылки в наборе данных, указывающие на незаконный контент в общедоступной сети», включая более 3000 предполагаемых случаев содержания с сексуальным насилием над детьми.

По меньшей мере 85 девочек в Бразилии также сообщили, что одноклассники приставали к ним, используя искусственный интеллект для создания откровенно сексуального дипфейкового контента «на основе фотографий, взятых из их контента в социальных сетях».

Защита частной жизни детей

По данным Ars, LAION-5B был представлен в 2022 году, как сообщается, для репликации набора данных OpenAI, и рекламировался как самый большой «свободно доступный набор изображений и текста».

Когда HRW связалась с LAION по поводу изображений, организация ответила, заявив, что модели искусственного интеллекта, обученные на LAION-5B, «не могут дословно воспроизводить данные детей», хотя они признали риски конфиденциальности и безопасности.

Затем организация начала удалять некоторые изображения, но также высказала мнение, что родители и опекуны несут ответственность за удаление личных фотографий детей из Интернета. Хан не согласился с их аргументом, сказав:

«Дети и их родители не должны брать на себя ответственность за защиту детей от технологий, от которых принципиально невозможно защититься. Это не их вина».

Он.

HRW призвала бразильских законодателей срочно вмешаться, чтобы защитить права детей от новых технологий. Согласно рекомендациям HRW, должны быть приняты новые законы, запрещающие использование данных детей в моделях искусственного интеллекта.

Криптополитический репортаж Энаси Мапакаме