Centrum raportowania śledczego (CIR) pozwało OpenAI i giganta technologicznego Microsoft za rzekome naruszenie praw autorskich. 

Pozew złożony przed sądem federalnym w Nowym Jorku zarzuca obu firmom wykorzystywanie treści z publikacji CIR, w tym Mother Jones i podcastu Reveal, bez odpowiedniego zezwolenia i odszkodowania. Oznacza to kolejne wyzwanie prawne dla OpenAI po wydaniu popularnego modelu sztucznej inteligencji, ChatGPT.

Szczegóły pozwu

Zgodnie ze skargą OpenAI i Microsoft wykorzystały ogromne ilości treści dziennikarskich CIR do szkolenia swoich modeli sztucznej inteligencji, w szczególności wcześniejszych wersji ChatGPT. Analiza przeprowadzona przez analityka danych wykazała, że ​​baza danych OpenWebText, z której korzysta OpenAI, zawierała ponad 17 000 adresów URL firmy Mother Jones i ponad 400 adresów URL firmy Reveal. 

[Pozew dotyczący praw autorskich AI] Centrum raportowania śledczego (za @MotherJones i @reveal) pozywa OpenAI i Microsoft za naruszenie praw autorskich. Cytaty: „Oskarżeni kopiowali, wykorzystywali, skracali i wyświetlali cenne treści CIR bez zgody i autoryzacji CIR oraz… pic.twitter.com/SeZ0VtDOMY

— Luiza Jarovsky (@LuizaJarovsky) 29 czerwca 2024 r

Liczby te wskazują na znaczne wykorzystanie materiałów chronionych prawem autorskim zebranych w ramach procesów, które rzekomo pozbawiły artykuły nagłówków, stopek i informacji o prawach autorskich, aby skupić się wyłącznie na treści artykułu.

Monika Bauerlein, dyrektor generalna CIR, stwierdziła: „Wykorzystywanie dziennikarstwa dla korzyści korporacyjnych bez godziwego wynagrodzenia podważa same podstawy naszej pracy”. W pozwie podkreślono, że oskarżeni mogli zdecydować się na poszanowanie twórczości dziennikarskiej, ale tego nie zrobili.

Kwestie technologiczne i etyczne

W skardze szczegółowo opisano technologie wykorzystywane przez OpenAI, takie jak algorytmy Dragnet i Newspaper, których zadaniem jest wyodrębnianie głównej treści ze stron internetowych, potencjalnie pomijając istotne elementy, takie jak nazwiska autorów i informacje o prawach autorskich. 

Powód twierdzi, że ta metoda skrobania danych ułatwiła naruszenie praw autorskich na dużą skalę, bezpośrednio wpływając na przychody i prawa twórców oryginalnych treści. Co więcej, w pozwie zarzuca się, że Microsoft był świadomy, że w pobranych danych brakowało istotnych informacji identyfikujących, co przyczyniło się do problemów związanych z naruszeniami, które są obecnie kwestionowane przez funkcje Bing AI i ChatGPT.

Konsekwencje i wcześniejsze działania prawne

Ten pozew stanowi uzupełnienie rosnącej listy batalii prawnych, z którymi OpenAI i Microsoft walczyły w związku z prawami autorskimi od czasu wprowadzenia ChatGPT. Inne znaczące publikacje, takie jak New York Times, The Intercept, New York Daily News i Chicago Tribune, również wszczęły postępowania sądowe przeciwko podmiotom technologicznym.

Z kolei kilku czołowych wydawców i platform cyfrowych zdecydowało się na zawarcie umów licencyjnych z OpenAI, umożliwiających zgodne z prawem korzystanie z ich archiwów. Partnerstwa z takimi podmiotami jak TIME Magazine, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow i Reddit podkreślają odmienne podejście do zarządzania ekspansywnym wykorzystaniem materiałów chronionych prawem autorskim przez sztuczną inteligencję.

Centrum Reportingu Śledczego domaga się odszkodowania za rzekome nieuprawnione wykorzystanie ich dzieł chronionych prawem autorskim, w tym zysków uzyskanych przez OpenAI i Microsoft za pośrednictwem treści CIR. Dochodzone odszkodowanie obejmuje co najmniej 750 dolarów za każde naruszone dzieło i 2500 dolarów za każde naruszenie ustawy Digital Millennium Copyright Act.

W miarę rozwoju postępowania sądowego wynik tej sprawy może mieć istotne konsekwencje dla działalności firm zajmujących się sztuczną inteligencją i wykorzystywania przez nie publicznie dostępnych treści cyfrowych w szkoleniach modeli sztucznej inteligencji. Zarówno społeczność technologiczna, jak i właściciele praw autorskich z uwagą obserwują ten rozwój, który może ustanowić precedensy na styku technologii sztucznej inteligencji i prawa autorskiego.

Wpis dotyczący plików CIR Nowy pozew dotyczący naruszenia praw autorskich przeciwko OpenAI i Microsoft po raz pierwszy pojawił się na Coinfea.