По данным ProofNews, многие ведущие мировые технологические корпорации, в том числе Apple, Nvidia и Salesforce, обвиняются в незаконном использовании данных с Youtube для обучения ИИ.
В частности, некоммерческая исследовательская группа по искусственному интеллекту EleutherAI собрала субтитры из сотен тысяч видеороликов на Youtube, чтобы создать «огромный» набор данных под названием Pile. Это действие считается серьёзным нарушением условий обслуживания YouTube.
Известно, что Pile содержит субтитры к более чем 173 000 видеороликов с более чем 48 000 каналов Youtube, включая удаленные видео. Этот набор данных затем используется многими крупными технологическими компаниями для обучения моделей искусственного интеллекта, от чат-ботов до механизмов обработки естественного языка.
Хотя некоторые компании, такие как Anthropic и Salesforce, признают, что используют Pile, они утверждают, что это «общедоступный» набор данных, и отрицают любые обвинения в нарушении авторских прав. Однако ProofNews отмечает, что список компаний, использующих Pile, может быть длиннее, поскольку многие подразделения не раскрывают публично источник своих данных для обучения ИИ.
Стоит отметить, что Pile не только содержит контент с обычных каналов Youtube, но также включает видео с известных каналов криптовалюты, таких как Coinbase, Cointelegraph и Bitcoin Magazine.
Этот инцидент еще раз вызывает обеспокоенность по поводу проблем авторского права на данные в сфере ИИ. Юристы полагают, что споры, связанные с использованием данных YouTube в коммерческих целях, будут увеличиваться, особенно в контексте гонки за развитием ИИ.
ProofNews сообщает, что OpenAI и Google в прошлом также собирали текст YouTube. В то время как Google, компания, владеющая YouTube, подтвердила, что ее действия находились в рамках соглашения с пользователями, OpenAI не подтвердила и не опровергла вышеуказанное сообщение.
На данный момент юридическая фирма Baker Hoestler перечисляет как минимум пятнадцать исков, связанных с такими технологическими компаниями, как: Anthropic, Meta, GitHub, Stability AI, Nvidia и Google. В частности, OpenAI сталкивается с крупными исками со стороны материнской компании Mother Jones и The New York Times. В целом правовая ситуация с авторским правом на данные в сфере ИИ становится все более напряженной в связи со сложным и непредсказуемым развитием событий.
Следите за новостями 24h, чтобы не пропустить ни одну из последних разработок в области блокчейна на Форуме популяризации блокчейна.