Laut ProofNews wird vielen der weltweit führenden Technologiekonzerne, darunter Apple, Nvidia und Salesforce, vorgeworfen, Daten von Youtube illegal zum Trainieren von KI genutzt zu haben.

Konkret hat die gemeinnützige KI-Forschungsgruppe EleutherAI Untertitel von Hunderttausenden Youtube-Videos gesammelt, um einen „riesigen“ Datensatz namens Pile zu erstellen. Diese Aktion gilt als schwerwiegender Verstoß gegen die Nutzungsbedingungen von YouTube.

Es ist bekannt, dass Pile Untertitel von mehr als 173.000 Videos von mehr als 48.000 Youtube-Kanälen enthält, darunter auch gelöschte Videos. Dieser Datensatz wird dann von vielen großen Technologieunternehmen zum Trainieren von KI-Modellen verwendet, von Chatbots bis hin zu Engines zur Verarbeitung natürlicher Sprache.

Obwohl einige Unternehmen wie Anthropic und Salesforce zugeben, Pile zu verwenden, argumentieren sie, dass es sich um einen „öffentlich zugänglichen“ Datensatz handele, und bestreiten jegliche Vorwürfe einer Urheberrechtsverletzung. Laut ProofNews könnte die Liste der Unternehmen, die Pile verwenden, jedoch länger sein, da viele Einheiten die Quelle ihrer KI-Trainingsdaten nicht öffentlich bekannt geben.

Es ist erwähnenswert, dass Pile nicht nur Inhalte von regulären YouTube-Kanälen enthält, sondern auch Videos von berühmten Kryptowährungskanälen wie Coinbase, Cointelegraph und Bitcoin Magazine.

Dieser Vorfall gibt erneut Anlass zur Besorgnis über Fragen des Datenurheberrechts im Bereich der KI. Rechtsexperten gehen davon aus, dass Streitigkeiten im Zusammenhang mit der Nutzung von YouTube-Daten für kommerzielle Zwecke zunehmen werden, insbesondere im Kontext des Wettlaufs um die Entwicklung von KI. 

ProofNews sagte, dass OpenAI und Google in der Vergangenheit auch YouTube-Text gesammelt hätten. Während Google, das Unternehmen, dem YouTube gehört, bestätigte, dass seine Handlungen im Rahmen seiner Vereinbarung mit den Nutzern erfolgten, bestätigte OpenAI den oben genannten Bericht weder, noch dementierte er es.

Bisher listet die Anwaltskanzlei Baker Hoestler mindestens fünfzehn Klagen im Zusammenhang mit Technologieunternehmen wie Anthropic, Meta, GitHub, Stability AI, Nvidia und Google auf. Insbesondere sieht sich OpenAI mit großen Klagen der Muttergesellschaft von Mother Jones und der New York Times konfrontiert. Generell wird die Rechtslage zum Datenurheberrecht im Bereich KI immer angespannter mit komplexen und unvorhersehbaren Entwicklungen.

Verfolgen Sie die 24h News, um keine der neuesten Blockchain-Entwicklungen im Blockchain Popularization Forum zu verpassen.