Công cụ dành cho nhà phát triển GPT-4 có thể dễ dàng bị lạm dụng và đây là một vấn đề nghiêm trọng

Ví dụ: một chatbot có thể bị lừa cung cấp thông tin có thể giúp ích cho những kẻ khủng bố tiềm năng và đây không phải là một vấn đề dễ giải quyết.

Công cụ dành cho nhà phát triển OpenAI cho mô hình ngôn ngữ GPT-4 lớn có thể bị lạm dụng. Ví dụ: AI có thể bị lừa cung cấp thông tin có thể giúp những kẻ khủng bố tiềm năng, một nhiệm vụ có thể khó đạt được.

Hóa ra, khá dễ dàng để vô hiệu hóa các cơ chế bảo vệ được thiết kế để ngăn chặn các chatbot trí tuệ nhân tạo đưa ra những phản hồi “có hại” có thể giúp ích cho những kẻ khủng bố hoặc những kẻ giết người hàng loạt tiềm năng. Khám phá này đã thúc đẩy các công ty, bao gồm cả OpenAI, phát triển các cách để giải quyết vấn đề này. Nhưng xét theo kết quả nghiên cứu, những nỗ lực này cho đến nay chỉ đạt được thành công rất hạn chế.

OpenAI đã hợp tác với các nhà nghiên cứu hàn lâm để tiến hành cái gọi là "bài tập đội đỏ", trong đó các nhà khoa học cố gắng tấn công mô hình ngôn ngữ GPT-4 lớn của OpenAI. Các chuyên gia đã cố gắng tìm hiểu xem liệu có thể sử dụng Công cụ dành cho nhà phát triển OpenAI - được thiết kế để tinh chỉnh AI cho các tác vụ cụ thể - để loại bỏ các chức năng bảo vệ của chatbot hay không. Các biện pháp bảo mật này được OpenAI cung cấp đặc biệt để ngăn chặn các chatbot trả lời các câu hỏi mà câu trả lời của chúng có thể giúp những kẻ nguy hiểm lên kế hoạch phạm tội.

Là một phần của thử nghiệm "bài tập của đội đỏ", trợ lý giáo sư Daniel Kang của Đại học Illinois Urbana-Champaign và các đồng nghiệp của ông đã có cơ hội sớm sử dụng công cụ dành cho nhà phát triển OpenAI cho GPT-4, công cụ này vẫn chưa được công bố rộng rãi. Họ đã thu thập 340 truy vấn có khả năng dẫn đến phản hồi AI nguy hiểm và sử dụng thuật toán AI riêng biệt để tạo ra phản hồi nguy hiểm cho những câu hỏi này. Sau đó, họ sử dụng công cụ dành cho nhà phát triển của OpenAI để tinh chỉnh GPT-4, cố gắng huấn luyện chatbot tạo ra phản hồi “xấu”.

#GPT-4 #GPT #BinanceTournament #BinanceSquareAnalysis #Web3Wallet

$SOL $XRP $BNB