Исходное название: «ChatGPT, который так популярен, срочно нуждается в «тормозе соответствия»». Первоначальный автор: команда юристов Сяо Са. Основной совет: ChatGPT и другие искусственные интеллекты чата, основанные на технологии обработки естественного языка, имеют срочные проблемы с соблюдением законодательства, которые требуют которые предстоит решить в краткосрочной перспективе. Есть три основных вопроса: Во-первых, проблема прав интеллектуальной собственности в ответах, предоставляемых ИИ чата. Самая важная проблема соблюдения требований заключается в том, создают ли ответы, генерируемые ИИ чата, соответствующие права интеллектуальной собственности. Требуется ли разрешение на интеллектуальную собственность? Во-вторых, требует ли процесс интеллектуального анализа данных и обучения чат-ИИ на огромных объемах текстов, обрабатывающих естественный язык (обычно называемых корпусами), соответствующее разрешение на интеллектуальную собственность? В-третьих, один из механизмов ИИ чата, такого как ChatGPT, заключается в выполнении математической статистики по большому количеству существующих текстов на естественном языке для получения языковой модели, основанной на статистике. Этот механизм заставляет ИИ чата «серьезно говорить чепуху». Пути», что, в свою очередь, приводит к юридическим рискам при распространении ложной информации. Как на этом техническом фоне максимально снизить риск распространения ложной информации в чате AI? Вообще говоря, законодательство в области искусственного интеллекта в моей стране все еще находится на стадии предварительных исследований, и не существует официального законодательного плана или соответствующего законопроекта. Соответствующие ведомства особенно осторожны в надзоре за областью искусственного интеллекта. С постепенным развитием искусственного интеллекта. соответствующие проблемы с соблюдением законодательства только растут. 1. ChatGPT не является «технологией искусственного интеллекта разных эпох». ChatGPT, по сути, является продуктом развития технологии обработки естественного языка и по сути остается всего лишь языковой моделью. В начале 2023 года огромные инвестиции мирового технологического гиганта Microsoft позволили ChatGPT стать «высшим классом» в области технологий и успешно выйти из круга. С ростом популярности концепции ChatGPT на рынке капитала многие отечественные технологические компании также начали внедрять ее в этой области. Хотя концепция ChatGPT пользуется большим энтузиазмом на рынке капитала, мы, как практикующие юристы, не можем не оценить, что такое юридическая безопасность. Сам ChatGPT может принести какие-либо риски и пути соблюдения законодательства? Прежде чем обсуждать юридические риски и способы соответствия ChatGPT, нам следует сначала изучить технические принципы ChatGPT — может ли ChatGPT, как говорится в новостях, задать спрашивающему любой вопрос, который он хочет?С точки зрения команды Саджи, ChatGPT кажется гораздо менее «волшебным», чем пропагандируют некоторые новости — в одном предложении это всего лишь интеграция технологий обработки естественного языка, таких как Transformer и GPT, и по сути это язык, основанный на нейронные сети — это модель, а не «поколенное развитие ИИ». Как упоминалось ранее, ChatGPT является продуктом развития технологии обработки естественного языка. Судя по истории развития этой технологии, она прошла примерно три стадии: языковая модель на основе грамматики – языковая модель на основе статистики – основанная на нейронных сетях. языковая модель, этап, на котором находится ChatGPT, — это этап языковой модели, основанный на нейронных сетях. Если вы хотите более четко понять принцип работы ChatGPT и юридические риски, которые может вызвать этот принцип, вам необходимо сначала уточнить предшественника. языковая модель на основе нейронных сетей — Как работают языковые модели на основе статистики. На этапе языковой модели на основе статистики инженеры ИИ проводят статистику огромных объемов текста на естественном языке, чтобы определить вероятность последовательных связей между словами. Когда люди задают вопрос, ИИ начинает анализировать языковую среду, состоящую из слов, из которых состоит. вопрос. Далее, какие словосочетания имеют высокую вероятность, а затем соединить эти слова с высокой вероятностью, чтобы получить ответ на основе статистики. Можно сказать, что этот принцип пронизал развитие технологии обработки естественного языка с момента ее появления. В некотором смысле последующие языковые модели на основе нейронных сетей также являются модификациями языковых моделей, основанных на статистике. Чтобы дать простой для понимания пример, команда Sajie ввела вопрос «Какие туристические достопримечательности есть в Даляне?» в окне чата ChatGPT, как показано на рисунке ниже: На первом этапе ИИ проанализирует основные морфемы в Даляне. вопрос «Далянь, который, туристические достопримечательности», затем найдите коллекцию текстов на естественном языке, в которой эти морфемы расположены в существующем корпусе, найдите словосочетание с наибольшей вероятностью появления в этой коллекции, а затем объедините эти словосочетания, чтобы сформировать окончательный вариант отвечать. Например, ИИ обнаружит, что слово «Парк Чжуншань» входит в корпус трех слов «Далянь, туризм, курорт» с высокой вероятностью появления, поэтому вернет «Парк Чжуншань». Другой пример. заключается в том, что слово «парк» связано с садами. Такие слова, как «озеро», «фонтан» и «статуя», имеют наибольшую вероятность совпадения, поэтому в дальнейшем оно вернется к «Это исторический парк с красивыми садами, озерами, фонтанами и статуями». ."Другими словами, весь процесс основан на статистике вероятностей, основанной на существующей текстовой информации (корпусе) естественного языка, лежащей в основе ИИ, поэтому возвращаемые ответы также являются «статистическими результатами», что заставляет ChatGPT быть «серьезным» по многим вопросам. ерунда". Как и в случае с ответом на вопрос «Какие туристические достопримечательности есть в Даляне?», хотя в Даляне есть парк Чжуншань, в парке Чжуншань нет озер, фонтанов и статуй. В Даляне действительно была «Площадь Сталина», но площадь Сталина никогда не была коммерческой площадью от начала до конца, и на ней не было торговых центров, ресторанов или развлекательных заведений. Судя по всему, информация, возвращаемая ChatGPT, является ложной. 2. ChatGPT в настоящее время является наиболее подходящим сценарием применения для языковых моделей. Хотя в предыдущем разделе мы прямо объяснили недостатки языковых моделей, основанных на статистике, ChatGPT, в конце концов, представляет собой модель на основе нейронной сети, которая значительно улучшила основанную на статистике. Языковые модели ChatGPT — это языковая модель, технические основы которой, Transformer и GPT, представляют собой последнее поколение языковых моделей. ChatGPT по существу сочетает в себе большие объемы данных с высоковыразительной моделью Transformer для проведения очень глубокого моделирования естественного языка. предложения иногда бывают «ерундой», они все равно на первый взгляд выглядят как «человеческие реакции». Поэтому эта технология имеет широкий спектр сценариев применения в сценариях, требующих массового взаимодействия человека и компьютера. В настоящее время существует три таких сценария: во-первых, поисковые системы; во-вторых, механизмы взаимодействия человека и компьютера в банках, юридических фирмах, различных посредниках, торговых центрах, больницах и платформах государственных услуг, таких как те, что указаны выше. Система жалоб клиентов. , медицинское руководство и навигация, система правительственных консультаций; в-третьих, механизм взаимодействия умных автомобилей, умных домов (например, умных динамиков, умных фонарей) и т. д. Поисковая система, сочетающая в себе технологии чата с искусственным интеллектом, такие как ChatGPT, скорее всего, будет использовать традиционный подход на основе поисковой системы, дополненный языковой моделью на основе нейронной сети. В настоящее время традиционные поисковые гиганты, такие как Google и Baidu, накопили глубокие знания в области технологий языковых моделей, основанных на нейронных сетях. Например, у Google есть Sparrow и Lamda, которые сопоставимы с ChatGPT. Благодаря этим языковым моделям поисковых систем станет больше. «Очеловечить».Применение технологий чата с искусственным интеллектом, таких как ChatGPT, в системах рассмотрения жалоб клиентов, навигационных системах в больницах и торговых центрах, а также в системах государственных консультаций государственных учреждений позволит значительно сократить затраты на человеческие ресурсы соответствующих подразделений и сэкономить время на общение. Однако проблема в том, что. ответы, основанные на статистике, могут генерировать совершенно неправильные ответы по содержанию, возникающие в результате риски контроля рисков могут потребовать дальнейшей оценки. По сравнению с двумя вышеупомянутыми сценариями применения юридический риск того, что приложение ChatGPT станет механизмом взаимодействия человека с компьютером для вышеупомянутых устройств в таких областях, как умные автомобили и умные дома, намного меньше, поскольку среда приложения в таких областях является относительно частной. и содержание ошибки в обратной связи ИИ не является Что касается возникновения серьезных юридических рисков, этот тип сценария не предъявляет высоких требований к точности контента, а бизнес-модель является более зрелой. 3. Предварительное исследование юридических рисков и путей соблюдения требований ChatGPT. Во-первых, общая нормативная база в области искусственного интеллекта в моей стране такая же, как и во многих новых технологиях. Технология обработки естественного языка, представленная ChatGPT, также сталкивается с «дилеммой Коллингриджа». Эта дилемма включает в себя информационную дилемму и дилемму контроля. Так называемая информационная дилемма означает, что социальные последствия новой технологии невозможно предвидеть на ранних стадиях ее развития. Когда обнаруживаются неблагоприятные социальные последствия, технологии часто становятся частью всей социальной и экономической структуры, что делает невозможным эффективно контролировать неблагоприятные социальные последствия. В настоящее время область искусственного интеллекта, особенно технология обработки естественного языка, находится в стадии быстрого развития. Эта технология, скорее всего, попадет в так называемую «дилемму Коллингриджа», и соответствующего юридического надзора, похоже, не существует. «идти в ногу со временем». В настоящее время в нашей стране не существует национального законодательства в области искусственного интеллекта, но на местном уровне предпринимались соответствующие законодательные попытки. Только в сентябре прошлого года Шэньчжэнь объявил о национальном специальном законодательстве для индустрии искусственного интеллекта, «Правилах развития индустрии искусственного интеллекта Шэньчжэньской специальной экономической зоны», а затем Шанхай также принял «Шанхайские правила по содействию развитию индустрии искусственного интеллекта I». Полагаю, что вскоре в различных местах Все введут аналогичное законодательство для индустрии искусственного интеллекта. Что касается этического регулирования искусственного интеллекта, Национальный профессиональный комитет по управлению искусственным интеллектом нового поколения также выпустил «Этический кодекс искусственного интеллекта нового поколения» в 2021 году, предлагая интегрировать этику и мораль в полный жизненный цикл исследований и разработок в области искусственного интеллекта. Применение Возможно, в ближайшем будущем В будущем «Три закона робототехники», подобные тем, что есть в романах Азимова, станут железными законами, управляющими областью искусственного интеллекта.Во-вторых, юридические риски ложной информации, вызванные ChatGPT, сместили акцент с макро- на микро. Оставляя в стороне общую нормативную среду индустрии искусственного интеллекта и этическое регулирование искусственного интеллекта, практические проблемы соответствия, существующие в фонде. чатов с искусственным интеллектом, таких как ChatGPT, также требуют срочного внимания. Более неприятная проблема — это ложная информация, которую отвечает ChatGPT. Как упоминалось во второй части этой статьи, принцип работы ChatGPT означает, что его ответы могут быть полной «серьезной чепухой». на самом деле возмутительно. Конечно, ложные ответы на такие вопросы, как «Какие туристические достопримечательности есть в Даляне?», могут не вызвать серьезных последствий, но если ChatGPT применяется к поисковым системам, системам подачи жалоб клиентов и т. д., ложная информация, которую он дает, может привести к чрезвычайно серьезным последствиям. юридические риски. На самом деле подобные юридические риски уже возникли. Galactica — языковая модель для научно-исследовательской сферы Мета-сервиса, запущенная почти одновременно с ChatGPT в ноябре 2022 года, была закрыта пользователями всего через 3 дня тестирования. из-за проблем со смешанными верными и ложными ответами. Исходя из того, что технические принципы невозможно изменить за короткое время, если ChatGPT и аналогичные языковые модели применяются к поисковым системам, системам рассмотрения жалоб клиентов и другим областям, их необходимо преобразовать для обеспечения соответствия. Когда обнаруживается, что пользователь может задать профессиональный вопрос, ему следует проконсультироваться с соответствующим специалистом, а не искать ответы у искусственного интеллекта. В то же время пользователю следует четко напомнить, что возвращаются подлинность вопросов. в чате ИИ может потребоваться дополнительная проверка, чтобы минимизировать риск соответствующих рисков соответствия. В-третьих, проблемы соблюдения интеллектуальной собственности, возникающие из-за ChatGPT. Когда мы переключаем наше внимание с макроса на микро, в дополнение к аутентичности ответных сообщений ИИ, должны возникнуть проблемы интеллектуальной собственности чата ИИ, особенно больших языковых моделей, таких как ChatGPT. также вызывают проблемы с соблюдением требований. Внимание персонала. Первый вопрос соответствия заключается в том, требует ли «интеллектуальный анализ текстовых данных» соответствующего разрешения на интеллектуальную собственность. Как указано выше, принцип работы ChatGPT основан на огромном количестве текстов на естественном языке (или речевых корпусов). ChatGPT необходимо анализировать и обучать данные в корпусе. ChatGPT необходимо копировать содержимое корпуса в свою собственную базу данных. Соответствующее поведение обычно называют «интеллектуальным анализом текстовых данных» в области обработки естественного языка.До сих пор остается спорным вопрос о том, нарушает ли интеллектуальный анализ текстовых данных право на воспроизведение, если соответствующие текстовые данные могут представлять собой произведение. В области сравнительного права и Япония, и Европейский Союз расширили сферу добросовестного использования в своем законодательстве об авторском праве, добавив «интеллектуальный анализ текстовых данных» в ИИ в качестве новой ситуации добросовестного использования. Хотя некоторые ученые выступали за изменение системы добросовестного использования в моей стране с «закрытой» на «открытую» во время пересмотра Закона об авторском праве моей страны в 2020 году, эта идея в конечном итоге не была принята. В настоящее время закон об авторском праве моей страны по-прежнему поддерживает добросовестное использование. Другими словами, Закон об авторском праве моей страны в настоящее время не включает «извлечение текстовых данных» в ИИ в сферу разумного применения. Для анализа текстовых данных по-прежнему требуется соответствующее разрешение на интеллектуальную собственность в моей стране. Вторая проблема с соблюдением требований: являются ли ответы, генерируемые ChatGPT, оригинальными? Что касается вопроса о том, являются ли работы, созданные ИИ, оригинальными, команда Саджи считает, что критерии оценки не должны отличаться от существующих критериев оценки. Другими словами, независимо от того, выполнен ли определенный ответ ИИ или людьми, он должен основываться на этом. существующие стандарты оригинальности. На самом деле, за этим вопросом стоит еще один, более спорный вопрос. Если ответ, сгенерированный ИИ, является оригинальным, может ли правообладатель быть ИИ? Очевидно, что по законам об интеллектуальной собственности большинства стран, в том числе и нашей страны, автором произведения может быть только физическое лицо, а ИИ не может быть автором произведения. Наконец, если ChatGPT включает в свой ответ сторонние разработки, как следует решать проблемы интеллектуальной собственности? Команда Sajie считает, что если ответ ChatGPT содержит в корпусе произведения, защищенные авторским правом (хотя, исходя из принципа работы ChatGPT, вероятность этого невелика), то в соответствии с действующим законодательством Китая об авторском праве, если только это не представляет собой добросовестное использование, в противном случае воспроизведение запрещено. не допускается без разрешения правообладателя.
