Das Center for Investigative Reporting (CIR) hat OpenAI und den Technologieriesen Microsoft wegen angeblicher Urheberrechtsverletzung verklagt.

Die Klage, die vor einem New Yorker Bundesgericht eingereicht wurde, wirft beiden Unternehmen vor, Inhalte aus CIR-Veröffentlichungen, darunter Mother Jones und der Reveal-Podcast, ohne entsprechende Genehmigung oder Vergütung verwendet zu haben. Dies stellt eine weitere rechtliche Herausforderung für OpenAI nach der Veröffentlichung seines beliebten KI-Modells ChatGPT dar.

Einzelheiten zur Klage

Der Beschwerde zufolge haben OpenAI und Microsoft riesige Mengen journalistischer Inhalte von CIR verwendet, um ihre künstlichen Intelligenzmodelle zu trainieren, insbesondere die früheren Versionen von ChatGPT. Die von einem Datenwissenschaftler durchgeführte Analyse ergab, dass die von OpenAI verwendete OpenWebText-Datenbank über 17.000 URLs von Mother Jones und mehr als 400 von Reveal enthielt.

[Urheberrechtsklage wegen KI] Das Center for Investigative Reporting (hinter @MotherJones & @reveal) verklagt OpenAI und Microsoft wegen Urheberrechtsverletzung. Zitate: „Die Angeklagten haben wertvolle Inhalte des CIR ohne dessen Erlaubnis oder Genehmigung kopiert, verwendet, gekürzt und angezeigt und … pic.twitter.com/SeZ0VtDOMY

– Luiza Jarovsky (@LuizaJarovsky), 29. Juni 2024

Diese Zahlen weisen auf eine erhebliche Verwendung von urheberrechtlich geschütztem Material hin, das durch Prozesse gesammelt wurde, bei denen angeblich Kopf- und Fußzeilen sowie Copyright-Vermerke aus den Artikeln entfernt wurden, um sich ausschließlich auf den Artikelinhalt zu konzentrieren.

Monika Bauerlein, Geschäftsführerin von CIR, erklärte: „Die Ausbeutung des Journalismus zum Vorteil von Unternehmen ohne angemessene Vergütung untergräbt die Grundlagen unserer Arbeit.“ In der Klage wird betont, dass die Angeklagten sich dazu hätten entscheiden können, journalistische Arbeit zu respektieren, dies aber nicht taten.

Technologische und ethische Bedenken

Die Beschwerde beschreibt die von OpenAI verwendeten Technologien ausführlicher, etwa die Dragnet- und Newspaper-Algorithmen, die darauf ausgelegt sind, Hauptinhalte aus Webseiten zu extrahieren und dabei möglicherweise wesentliche Elemente wie Autorennamen und Copyright-Informationen wegzulassen.

Der Kläger argumentiert, dass diese Methode des Daten-Scrapings Urheberrechtsverletzungen in großem Umfang ermöglichte, was sich direkt auf die Einnahmen und Rechte der ursprünglichen Inhaltsersteller auswirkte. Darüber hinaus behauptet die Klage, dass Microsoft sich darüber im Klaren war, dass den Scraped-Daten wesentliche Identifizierungsinformationen fehlten, was zu den Urheberrechtsverletzungen beitrug, die nun durch die Funktionen von Bing AI und ChatGPT angefochten werden.

Auswirkungen und frühere rechtliche Schritte

Diese Klage reiht sich in die lange Liste der Rechtsstreitigkeiten ein, die OpenAI und Microsoft seit der Einführung von ChatGPT wegen Urheberrechtsfragen führen mussten. Auch andere namhafte Publikationen wie die New York Times, The Intercept, die New York Daily News und die Chicago Tribune haben Gerichtsverfahren gegen die Technologieunternehmen eingeleitet.

Im Gegensatz dazu haben sich mehrere namhafte Verlage und digitale Plattformen für Lizenzvereinbarungen mit OpenAI entschieden, die eine rechtmäßige Nutzung ihrer Archive ermöglichen. Partnerschaften mit Unternehmen wie TIME Magazine, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow und Reddit zeigen einen anderen Ansatz im Umgang mit der umfangreichen Nutzung urheberrechtlich geschützter Materialien durch KI.

Das Center for Investigative Reporting fordert Entschädigung für die angeblich unbefugte Nutzung seiner urheberrechtlich geschützten Werke, einschließlich der Gewinne, die OpenAI und Microsoft durch CIR-Inhalte erzielt haben. Der geforderte Schadenersatz beträgt mindestens 750 US-Dollar für jedes verletzte Werk und 2.500 US-Dollar für jeden Verstoß gegen den Digital Millennium Copyright Act.

Im weiteren Verlauf des Gerichtsverfahrens könnte der Ausgang dieses Falls erhebliche Auswirkungen auf die Geschäftstätigkeit von KI-Unternehmen und ihre Verwendung öffentlich verfügbarer digitaler Inhalte zum Trainieren von KI-Modellen haben. Sowohl die Technologiegemeinschaft als auch die Urheberrechtsinhaber beobachten diese Entwicklungen aufmerksam, die Präzedenzfälle an der Schnittstelle zwischen KI-Technologie und Urheberrecht schaffen werden.

Der Beitrag „CIR reicht neue Klage wegen Urheberrechtsverletzung gegen OpenAI und Microsoft ein“ erschien zuerst auf Coinfea.