Новый закон Европейского Союза (ЕС) об искусственном интеллекте заставит компании раскрывать данные обучения, что вызовет серьезные дебаты по поводу прав интеллектуальной собственности.

Рождение ChatGPT знаменует собой важную веху, открывающую бурную эпоху генеративного ИИ (Gen AI). Всего за 18 месяцев эта технология привлекла огромное количество инвестиций и нашла широкое применение во многих областях. Генеративный искусственный интеллект — это набор приложений, которые могут быстро создавать текст, изображения и аудиоконтент.

Однако, по данным Reuters, помимо больших преимуществ, генеративный ИИ также вызывает множество юридических проблем, особенно историю происхождения обучающих данных.

Понимая эти проблемы, Европейский Союз (ЕС) инициировал принятие Закона об искусственном интеллекте, который, как ожидается, вступит в силу в течение следующих 2 лет. Одним из наиболее примечательных пунктов этого закона является требование о том, что организации, внедряющие модели искусственного интеллекта общего назначения, обычно ChatGPT, должны прозрачно раскрывать данные обучения. В частности, они должны предоставить «подробное описание» использованных источников данных, включая текст, изображения и аудио.

Ожидается, что это постановление частично решит проблему нарушения авторских прав, поскольку многие компании, занимающиеся искусственным интеллектом, обвиняются в незаконном использовании книг, фильмов и других произведений искусства для обучения искусственного интеллекта без разрешения автора.

Однако этот шаг встретил сильное сопротивление со стороны технологических компаний. Они считают, что раскрытие данных о тренировках похоже на «раскрытие секретной формулы», ставящее их в невыгодное положение в условиях жесткой конкуренции.

Г-н Матье Риуф, генеральный директор Photoroom, компании, специализирующейся на редактировании фотографий с использованием ИИ, сказал: «Публикация данных обучения ИИ — это все равно, что заставить известного шеф-повара раскрыть свои секретные рецепты». С этой точкой зрения также согласны многие другие технологические гиганты, такие как Google и Meta, которые делают ставку на ИИ.

Уровень детализации в этих отчетах о прозрачности окажет большое влияние на небольшие стартапы в области искусственного интеллекта и крупные технологические компании, такие как Google и Meta, которые поставили эту технологию в основу своей будущей деятельности.

За последний год несколько известных технологических компаний, в том числе Google, OpenAI и Stability AI, столкнулись с судебными исками со стороны авторов, утверждавших, что их контент ненадлежащим образом использовался для обучения моделей. Хотя президент США Джо Байден издал несколько указов, посвященных рискам безопасности, связанным с ИИ, вопросы авторского права еще не были полностью проверены. Требования, обязывающие технологические компании платить правообладателям, получили поддержку обеих партий в Конгрессе.

Столкнувшись с давлением общественного мнения, технологические гиганты начали «умиротворять» серией соглашений о лицензировании контента с медиа-агентствами. Обычно OpenAI подписывает соглашения с Financial Times и The Atlantic, а Google объединилась с социальной сетью Reddit, принадлежащей NewsCorp.

Однако этих шагов все еще недостаточно, чтобы успокоить общественное мнение. OpenAI продолжала подвергаться критике, когда технический директор Мира Мурати отказалась отвечать на вопросы о том, использовала ли компания видео YouTube для обучения Sora — инструмента для создания видео с использованием искусственного интеллекта — или нет. Инцидент с искусственным голосом актрисы Скарлетт Йоханссон в последней версии ChatGPT усилил волну противодействия OpenAI.

В разгар разногласий Томас Вольф, соучредитель Hugging Face, высказался в поддержку прозрачности данных, но признал, что эта точка зрения не получила консенсуса в отрасли.

Между тем, европейские законодатели также придерживаются неоднозначных мнений. Конгрессмен Драгош Тудораче, один из разработчиков закона об искусственном интеллекте, заявил, что обнародование данных обучения необходимо для обеспечения прав создателей контента. «Они имеют право знать, используется ли их работа для обучения ИИ», — подчеркнул он.

Битва между прозрачностью данных и коммерческой тайной в области искусственного интеллекта становится острее, чем когда-либо. Эксперты прогнозируют, что это станет одной из самых больших проблем, с которыми политики и бизнес столкнутся в ближайшем будущем.