Центр журналістських розслідувань (CIR) подав до суду на OpenAI і технічного гіганта Microsoft за ймовірне порушення авторських прав. 

Позов, поданий до федерального суду Нью-Йорка, звинувачує обидві компанії у використанні контенту з публікацій CIR, включаючи Mother Jones і подкаст Reveal, без належного дозволу чи компенсації. Це є ще одним юридичним викликом для OpenAI після випуску його популярної моделі ШІ ChatGPT.

Деталі позову

Згідно зі скаргою, OpenAI і Microsoft використовували величезну кількість журналістського контенту з CIR для навчання своїх моделей штучного інтелекту, зокрема попередніх версій ChatGPT. Аналіз, проведений фахівцем з даних, показав, що база даних OpenWebText, яку використовує OpenAI, містить понад 17 000 URL-адрес від Mother Jones і понад 400 від Reveal. 

[Позов щодо авторських прав AI] Центр журналістських розслідувань (за @MotherJones і @reveal) подає до суду на OpenAI і Microsoft за порушення авторських прав. Цитати: «Відповідачі скопіювали, використали, скоротили та показали цінний вміст CIR без дозволу чи авторизації CIR, і… pic.twitter.com/SeZ0VtDOMY

— Луїза Яровскі (@LuizaJarovsky) 29 червня 2024 р

Ці цифри вказують на значне використання захищених авторським правом матеріалів, зібраних за допомогою процесів, які нібито позбавляли статті верхніх і нижніх колонтитулів і поміток про авторські права, щоб зосередитися виключно на вмісті статті.

Моніка Бауерляйн, генеральний директор CIR, заявила: «Експлуатація журналістики для корпоративної вигоди без справедливої ​​компенсації підриває саму основу нашої роботи». У позові наголошується, що відповідачі могли вибрати повагу до журналістських творів, але вирішили цього не робити.

Технологічні та етичні проблеми

У скарзі детально описані технології, які використовує OpenAI, такі як алгоритми Dragnet і Newspaper, призначені для вилучення основного вмісту з веб-сторінок, потенційно пропускаючи такі важливі елементи, як імена авторів і інформацію про авторські права. 

Позивач стверджує, що цей метод збирання даних сприяв широкомасштабному порушенню авторських прав, безпосередньо вплинувши на доходи та права творців оригінального вмісту. Крім того, у позові стверджується, що корпорація Майкрософт знала, що зібрані дані не містять суттєвої ідентифікаційної інформації, що сприяло виникненню проблем із порушенням прав, які зараз вирішуються функціями Bing AI і ChatGPT.

Наслідки та попередні судові позови

Цей позов доповнює список судових баталій, з якими OpenAI і Microsoft зіткнулися щодо авторських прав, що постійно зростає з моменту появи ChatGPT. Інші відомі видання, такі як New York Times, The Intercept, New York Daily News і Chicago Tribune, також порушили судові процеси проти технологічних організацій.

Натомість кілька відомих видавців і цифрових платформ уклали ліцензійні угоди з OpenAI, що дозволяє законне використання їхніх архівів. Партнерство з такими організаціями, як TIME Magazine, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow і Reddit, підкреслює інший підхід до керування широким використанням ШІ матеріалів, захищених авторським правом.

Центр журналістських розслідувань вимагає компенсації за ймовірне несанкціоноване використання їхніх творів, захищених авторським правом, включаючи прибуток, отриманий OpenAI і Microsoft через вміст CIR. Відшкодування збитків включає мінімум 750 доларів США за кожну порушену роботу та 2500 доларів США за кожне порушення Закону про захист авторських прав у цифрову епоху.

У міру розгортання судового процесу результат цієї справи може мати значні наслідки для діяльності компаній ШІ та використання ними загальнодоступного цифрового контенту для навчання моделей ШІ. Технологічне співтовариство та власники авторських прав уважно спостерігають за цими розробками, які створюють прецеденти на перетині технології ШІ та законодавства про авторське право.

Публікація CIR подала новий позов про порушення авторських прав проти OpenAI і Microsoft вперше з’явилася на Coinfea.