The New York Times раскрывает методологию, используемую OpenAI для сбора миллионов часов стенограмм видео YouTube для создания огромных данных, необходимых для их мощной модели искусственного интеллекта GPT-4. Хотя может показаться, что эти компании идут по одному и тому же пути, образуя очередь во главе с гигантами Google и Meta, этот путь ускоряется по мере совершенствования технологий искусственного интеллекта. Все это приводит к вопросу о «цифровом разрыве» и о том, какое влияние он оказывает на способность человека участвовать в экономике, особенно на таких вопросах, как авторское право и этика данных.

Смелая тактика сбора данных OpenAI

OpenAI обнаружила и проанализировала этот контент на YouTube. Эта стратегия, несмотря на инновационный характер свободного использования, затрагивает принципы справедливого использования, что является предпосылкой возможности для этой компании. Запись видеороликов на YouTube — один из этапов процесса обучения искусственного интеллекта, принадлежащий Google, — вызывает обеспокоенность по поводу нарушения авторских прав и этических проблем, связанных с использованием данных без согласия автора.

Забавно, что после того, как Google подверглась критике как компания, владеющая YouTube, за то же самое, они якобы применили подобную практику для своих моделей искусственного интеллекта. Этот общий процесс слежки, очевидно, является интересной частью отчета, который еще больше раскрывает запутанные этические и юридические границы технологических компаний в их усилиях по искусственному интеллекту. С другой стороны, Google упомянул, что они могут получить разрешение создателя на использование видео перед обучением системы искусственного интеллекта на этих данных, что в конечном итоге становится предметом разногласий в повествовании.

Пересмотр политики конфиденциальности

Одним из главных событий этого процесса стало Google — корпоративная мера по изменению своей политики конфиденциальности к концу июня 2023 года. Таким образом, стратегия была направлена ​​на расширение возможностей компании по извлечению выгоды из общедоступных источников данных, начиная от документов Google и заканчивая Картами Google. обзоры для укрепления инноваций, основанных на искусственном интеллекте. Это указывает на более широкое явление в технологическом секторе, когда эти крупные технологические компании лидируют как в области инноваций, так и в области конфиденциальности пользователей, пытаясь найти правильный баланс между ними.

Именно сейчас вместе с этими технологическими гигантами раскрытие OpenAI и Google их методов сбора данных без явного согласия поднимает вопросы, касающиеся хода развития ИИ и этичного использования данных. Bloomberg процитировал Нила Мохана, генерального директора YouTube, по этой теме, и он сказал, что платформа не разрешает загрузку этих неавторизованных источников.

Промышленность и правовые последствия

Тогда возникает вопрос о моральности и законности этих усилий по сбору данных из-за двусмысленности. Еще одна область для улучшения связана с проблемами плагиата, поскольку эти подходы могут быть творческими, но также могут вызвать проблемы с авторским правом. Вопросы конфиденциальности также вызывают беспокойство в этой отрасли. Однако сфера действия этих ошибок не ограничивается только юридическими и этическими проблемами, но выходит далеко за их рамки. Из-за обилия они привлекают внимание к более значимой гонке технологий (технологий искусственного интеллекта), которая направлена ​​на использование данных для стимулирования достижений искусственного интеллекта.

Поскольку пионеры технологий искусственного интеллекта, такие как OpenAI и Google, стремятся расширить сферу применения следующей парадигмы искусственного интеллекта, дебаты о том, какие объемы данных можно использовать, каковы соображения по защите авторских прав, а также огромные социальные последствия приложений искусственного интеллекта расширяются. Сочетание инноваций с этикой приводит к более сложной картине, требующей разработки принципов регулирования и четкой политики.

Работа OpenAI и Google по использованию видео YouTube в учебных целях порождает многомерную проблему субъективного характера, состоящую из юридических, этических и технологических аспектов. Таким образом, технологический сектор постоянно сталкивается с такими проблемами, как инновации, конфиденциальность и этика, без которых не может быть обеспечен дальнейший рост. Дискуссия по этим вопросам будет продолжена. Тем не менее, это также будет распространяться на каждую заинтересованную сторону общества, от юристов до самих разработчиков ИИ, чтобы в конечном итоге предложить предлагаемое решение.

Оригинальная история взята из https://www.neowin.net/news/google-reportedly-let-openai-transcribe-a-million-hours-of-youtube-videos-to-train-gpt-4/.