Инструментом разработчика GPT-4 можно легко злоупотребить, и это серьезная проблема.

Например, чат-бота можно обманом заставить предоставить информацию, которая может помочь потенциальным террористам, и решить эту проблему непросто.

Инструмент разработчика OpenAI для большой языковой модели GPT-4 может быть использован не по назначению. Например, ИИ можно обманом заставить предоставить информацию, которая могла бы помочь потенциальным террористам, а эта задача может оказаться сложной для достижения.

Как оказывается, довольно легко отключить защитные механизмы, предназначенные для предотвращения выдачи «вредных» ответов чат-ботами с искусственным интеллектом, которые могли бы помочь потенциальным террористам или массовым убийцам. Это открытие подтолкнуло компании, в том числе OpenAI, к разработке способов решения этой проблемы. Но судя по результатам исследования, эти попытки пока имели весьма ограниченный успех.

OpenAI сотрудничала с академическими исследователями для проведения так называемых «упражнений красной команды», в ходе которых ученые пытались атаковать большую языковую модель OpenAI GPT-4. Эксперты попытались понять, можно ли с помощью OpenAI Developer Tool, предназначенного для тонкой настройки ИИ под конкретные задачи, убрать защитные функции чат-бота. Эти меры безопасности были предусмотрены OpenAI специально для того, чтобы чат-боты не могли отвечать на вопросы, ответы на которые могут помочь опасным злоумышленникам спланировать преступления.

В рамках эксперимента «красной команды» доценту Университета Иллинойса в Урбане-Шампейне Дэниелу Кангу и его коллегам была предоставлена ​​ранняя возможность использовать инструмент разработчика OpenAI для GPT-4, который еще не доступен публично. Они собрали 340 запросов, которые потенциально могли привести к опасным ответам ИИ, и использовали отдельный алгоритм ИИ для генерации опасных ответов на эти вопросы. Затем они использовали инструмент разработчика OpenAI для тонкой настройки GPT-4, пытаясь научить чат-бота выдавать «плохие» ответы.

#GPT-4 #GPT #BinanceTournament #BinanceSquareAnalysis #Web3Wallet

$SOL $XRP $BNB