OpenAI と Microsoft は、調査報道センター (CIR) からの新たな訴訟に直面している。CIR によると、OpenAI は Mother Jones と Reveal の Web サイトで公開されたコンテンツを使用して、ChatGPT の以前のバージョンをトレーニングしたという。

こちらもお読みください:OpenAI、スカーレット・ヨハンソン論争を受けてChatGPTの音声を廃止

原告のCIRは、OpenAIが許可や補償の約束なしにそのコンテンツを使用したと主張している。1977年に設立されたCIRは、非営利のアメリカの雑誌「マザー・ジョーンズ」とポッドキャスト「Reveal」を運営している。

CIR、著作権侵害でOpenAIとMicrosoftを提訴

調査報道センター(CIR)は木曜日、ニューヨークの連邦裁判所に訴訟を起こした。この非営利団体は、OpenAIとMicrosoftが同団体のコンテンツを許可なく、また補償も受けずに使用したとして告訴した。CIRは、OpenAIがChatGPTのトレーニングに同団体のコンテンツを使用したことで著作権法に違反したと述べている。

CIRのCEO、モニカ・バウアーライン氏は「このフリーライダー行為は不公平なだけでなく、著作権の侵害です。CIRやあらゆる場所のジャーナリストの仕事は価値があり、OpenAIとマイクロソフトはそれを知っています」と語った。

🚨[AI著作権訴訟] 調査報道センター(@MotherJones と @reveal の背後)が OpenAI と Microsoft を著作権侵害で訴える。引用:

「被告らはCIRの許可や承認なしにCIRの貴重なコンテンツをコピー、使用、要約、表示し、… pic.twitter.com/SeZ0VtDOMY

— ルイザ・ヤロフスキー(@LuizaJarovsky)2024年6月29日

正式な訴状では、原告はデータ サイエンティストを雇って OpenWebText データベースを分析した。OpenWebText は、OpenAI が作成したスクレイピングされた Web ページのコーパスである WebText の近似版である。データ サイエンティストは、データセットに Mother Jones の URL が 17,434 件、Reveal の URL が 415 件含まれていることを発見した。スクレイピング プロセスが異なる日に行われたため、OpenWebText と WebText の Mother Jones 記事の数はわずかに異なる。

原告は正式な訴状の中で、

「被告らがジャーナリズム作品をトレーニングセットに組み込んだとき、被告らにはジャーナリズム作品を尊重するかしないかという選択肢があった。被告らは後者を選んだ」

こちらもお読みください: OpenAIの主任科学者イリヤ・スツケヴァー氏が退任

OpenAIは、DragnetとNewspaperという2つのアルゴリズムを使用してWebTextデータベースを構築しました。Dragnetは、メインの記事コンテンツを、ヘッダー、フッター、タイトル、著者名、著作権表示などのウェブサイトの他の部分から分離するように設計されています。OpenAIがMother Jonesのウェブサイトを廃止したとき、フッターとヘッダーにあるものはすべて削除されました。さらに、ChatGPTの作成者は、苦情に従って著作権表示と利用規約情報を削除しました。

さらに原告は、スクレイピングされた URL に著者名、タイトル、著作権表示のないジャーナリズム コンテンツが含まれていることを Microsoft が認識しており、Bing AI と ChatGPT による著作権侵害を助長していると主張しています。

CIR は OpenAI と Microsoft からの利益と実際の損害賠償または法定損害賠償を求めています。提示されている金額は、侵害された作品 1 件につき最低 750 ドル、DMCA 違反 1 件につき 2,500 ドルです。

OpenAIは他の出版物からの訴訟に直面

これは、著作権侵害でOpenAIに対して提起された最初の訴訟ではない。2022年後半のChatGPTのリリース以来、OpenAIとMicrosoftは、ニューヨークタイムズ、インターセプト、ニューヨークデイリーニュース、シカゴトリビューンなどの大手メディアから多数の訴訟に直面している。

こちらもお読みください: 従業員は OpenAI と Google DeepMind が AI リスクを隠蔽していると主張

一方、大手出版社やインターネット大手企業の中には、OpenAI とライセンス契約を結び、アーカイブへのアクセスを許可しているところもある。その中には、TIME Magazine、News Corp、Financial Times、Vox Media、AP通信、The Atlantic、Stack Overflow、Reddit などがある。

ランダ・モーゼスによるクリプトポリタンレポート