Центр журналистских расследований (CIR) подал в суд на OpenAI и технологического гиганта Microsoft за предполагаемое нарушение авторских прав. 

В иске, поданном в федеральный суд Нью-Йорка, обе компании обвиняются в использовании контента из публикаций CIR, включая Mother Jones и подкаст Reveal, без надлежащего разрешения или компенсации. Это знаменует собой еще одну юридическую проблему для OpenAI после выпуска популярной модели искусственного интеллекта ChatGPT.

Подробности иска

Согласно жалобе, OpenAI и Microsoft использовали огромное количество журналистского контента из CIR для обучения своих моделей искусственного интеллекта, в частности более ранних версий ChatGPT. Анализ, проведенный специалистом по данным, показал, что база данных OpenWebText, используемая OpenAI, содержит более 17 000 URL-адресов от Mother Jones и более 400 от Reveal. 

[Иск об авторских правах AI] Центр журналистских расследований (стоящий за @MotherJones и @reveal) подает в суд на OpenAI и Microsoft за нарушение авторских прав. Цитаты: «Обвиняемые копировали, использовали, сокращали и отображали ценный контент CIR без разрешения или разрешения CIR и… pic.twitter.com/SeZ0VtDOMY

– Луиза Яровски (@LuizaJarinsky) 29 июня 2024 г.

Эти цифры указывают на значительное использование материалов, защищенных авторским правом, собранных в ходе процессов, которые предположительно лишили статьи верхних и нижних колонтитулов и уведомлений об авторских правах, чтобы сосредоточиться исключительно на содержании статьи.

Моника Бауэрляйн, генеральный директор CIR, заявила: «Использование журналистики в целях корпоративной выгоды без справедливой компенсации подрывает саму основу нашей работы». В иске подчеркивается, что ответчики могли уважать журналистские произведения, но предпочли этого не делать.

Технологические и этические проблемы

В жалобе дополнительно подробно описываются технологии, используемые OpenAI, такие как алгоритмы Dragnet и Newspaper, предназначенные для извлечения основного контента с веб-страниц, при этом потенциально могут быть упущены такие важные элементы, как имена авторов и информация об авторских правах. 

Истец утверждает, что этот метод очистки данных способствовал крупномасштабному нарушению авторских прав, напрямую влияя на доходы и права создателей оригинального контента. Более того, в иске утверждается, что Microsoft знала, что в скопированных данных не хватает важной идентификационной информации, что способствовало возникновению проблем с нарушением прав, которые теперь оспариваются функциями Bing AI и ChatGPT.

Последствия и предыдущие судебные иски

Этот иск пополнил растущий список юридических баталий, с которыми столкнулись OpenAI и Microsoft по вопросам авторских прав с момента появления ChatGPT. Другие известные издания, такие как New York Times, The Intercept, New York Daily News и Chicago Tribune, также инициировали судебные разбирательства против технологических компаний.

Напротив, несколько известных издателей и цифровых платформ выбрали лицензионные соглашения с OpenAI, позволяющие законное использование их архивов. Партнерские отношения с такими организациями, как журнал TIME, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow и Reddit, подчеркивают другой подход к управлению широким использованием ИИ материалов, защищенных авторским правом.

Центр журналистских расследований требует компенсации за предполагаемое несанкционированное использование их работ, защищенных авторским правом, включая прибыль, полученную OpenAI и Microsoft через контент CIR. Требуемый ущерб включает минимум 750 долларов за каждое произведение, права на которое нарушены, и 2500 долларов за каждое нарушение Закона об авторском праве в цифровую эпоху.

По мере развития судебного разбирательства исход этого дела может иметь серьезные последствия для деятельности компаний, занимающихся искусственным интеллектом, и использования ими общедоступного цифрового контента для обучения моделей искусственного интеллекта. Технологическое сообщество и правообладатели внимательно наблюдают за этими событиями, которые призваны создать прецеденты на стыке технологий искусственного интеллекта и законодательства об авторском праве.

Сообщение CIR подает новый иск о нарушении авторских прав против OpenAI и Microsoft впервые появился на Coinfea.