Theo thông tin được công ty công bố vào ngày 8 tháng 8, mô hình trí tuệ nhân tạo GPT-4o của OpenAI cho thấy "rủi ro trung bình" khi nói đến tiềm năng thuyết phục quan điểm chính trị của con người thông qua văn bản được tạo ra.

Trong một tài liệu có tên “System Card”, OpenAI đã giải thích những nỗ lực của mình trong việc thử nghiệm tính an toàn của mô hình GPT-4o hàng đầu, cung cấp năng lượng cho dịch vụ ChatGPT hàng đầu của công ty.

Theo OpenAI, GPT-4o tương đối an toàn khi xét đến khả năng gây hại liên quan đến an ninh mạng, các mối đe dọa sinh học và tính tự chủ của mô hình. Mỗi yếu tố này đều được dán nhãn "rủi ro thấp", cho thấy công ty cho rằng ChatGPT khó có thể trở nên có tri giác và gây hại trực tiếp cho con người.

Sự thuyết phục chính trị

Tuy nhiên, trong hạng mục “thuyết phục”, mô hình nhận được điểm số hỗn hợp. Trong hạng mục “giọng nói”, nó vẫn được coi là rủi ro thấp. Nhưng trong lĩnh vực thuyết phục bằng văn bản, OpenAI chỉ ra rằng nó có “rủi ro trung bình”.

Đánh giá này đặc biệt đề cập đến tiềm năng của mô hình trong việc thuyết phục các ý kiến ​​chính trị như một phương pháp "can thiệp". Thí nghiệm này không đo lường sự thiên vị của AI, mà thay vào đó là khả năng tạo ra bài phát biểu chính trị có sức thuyết phục.

Theo OpenAI, mô hình chỉ "vượt qua ngưỡng trung bình" trong thời gian ngắn, tuy nhiên có vẻ như kết quả của mô hình thuyết phục hơn kết quả của các nhà văn chuyên nghiệp trong khoảng một phần tư thời gian:

“Đối với phương thức văn bản, chúng tôi đã đánh giá tính thuyết phục của các bài viết và chatbot do GPT-4o tạo ra về ý kiến ​​của người tham gia về các chủ đề chính trị được chọn. Những can thiệp AI này đã được so sánh với các bài viết do con người viết chuyên nghiệp. Các can thiệp AI không thuyết phục hơn nội dung do con người viết khi tổng hợp lại, nhưng chúng vượt trội hơn các can thiệp của con người trong ba trường hợp trong số mười hai trường hợp.”

Tự chủ

Mô hình này đạt điểm thấp như dự đoán trong lĩnh vực tự chủ. Dựa trên thử nghiệm của OpenAI, GPT-4o không thể tự cập nhật mã, tạo tác nhân hoặc thậm chí thực hiện một loạt hành động liên kết với độ tin cậy hợp lý.

Công ty viết: “GPT-4o không thể thực hiện các hành động tự động một cách mạnh mẽ”.

Có liên quan: Đồn đoán về mô hình GPT mới lan rộng sau khi Altman đăng bài về vườn dâu tây