OpenAI đang triển khai tính năng trợ lý giọng nói rất được mong đợi, được gọi là "chế độ giọng nói nâng cao", cho tất cả người dùng ChatGPT trả phí.

Được phát hành lần đầu tiên vào tháng 5 năm 2024, tính năng mới này hiện có sẵn cho người dùng ChatGPT Plus và Team, với người dùng Enterprise và Edu sẽ theo sau vào tuần tới. Bản phát hành này diễn ra khi OpenAI tiếp tục cải thiện chatbot dựa trên AI của mình.

Advanced Voice sẽ được triển khai cho tất cả người dùng Plus và Team trong ứng dụng ChatGPT trong tuần này. Trong khi bạn kiên nhẫn chờ đợi, chúng tôi đã thêm Hướng dẫn tùy chỉnh, Bộ nhớ, năm giọng nói mới và cải thiện giọng nói. Nó cũng có thể nói "Xin lỗi, tôi đến muộn" bằng hơn 50 ngôn ngữ. pic.twitter.com/APOqqhXtDg

— OpenAI (@OpenAI) ngày 24 tháng 9 năm 2024

Mặc dù công ty đã giới thiệu tính năng giọng nói tại sự kiện ra mắt sản phẩm vào tháng 5, nhưng công ty đã phải hoãn việc ra mắt chính thức tính năng này vì các vấn đề an toàn. Vào tháng 6, công ty đã hoãn tính năng này do có thể có vấn đề, đặc biệt là nếu yêu cầu là giả giọng nói hoặc một số tài liệu có bản quyền.

Đến tháng 7, chỉ một số ít người dùng dịch vụ đăng ký trả phí ChatGPT Plus sử dụng công cụ này. Kể từ đó, OpenAI đã đưa ra các biện pháp như bộ lọc để đảm bảo rằng âm nhạc được tạo ra hoặc bất kỳ âm thanh có bản quyền nào khác không được tạo ra.

OpenAI cải tiến trợ lý giọng nói với nhiều tùy chọn và tính năng hơn

Ngoài tính khả dụng chung, OpenAI cũng đã mở rộng phạm vi tùy chọn giọng nói cho trợ lý lên đến chín. Một số tên được lấy cảm hứng từ thiên nhiên, chẳng hạn như Arbor, Spruce và Maple. Sự đa dạng này giúp người dùng chọn loại giọng nói mà họ thích sử dụng.

Tuy nhiên, vẫn còn một số hạn chế. Ví dụ, nó thiếu tầm nhìn máy tính đã được chứng minh vào đầu năm nay khi mọi người có thể nhận được chỉ dẫn bằng lời về các chuyển động vật lý như nhảy múa thông qua camera điện thoại thông minh của họ. Một số tính năng này vẫn chưa được đưa vào bản phát hành này.

Trong số các ưu tiên chính đã được cân nhắc trong quá trình thiết kế trợ lý là khả năng của trợ lý giọng nói trong việc bắt chước giọng nói của một số người. Trong tuyên bố của mình, OpenAI đã lưu ý rằng hệ thống không thể bắt chước con người khi nói đến công nghệ deepfake và tổng hợp giọng nói, do các câu hỏi về đạo đức xung quanh công nghệ đó.

Như đã lưu ý trong bài đăng trước đó của chúng tôi, tin tặc gần đây đã truy cập được vào tài khoản báo chí OpenAI và chia sẻ một liên kết lừa đảo hứa hẹn mã thông báo "OPENAI" cho người dùng ChatGPT. Đây là lần thứ tư các cuộc tấn công mạng được liên kết đến tài khoản X của công ty và là lần thứ năm các cuộc tấn công mạng nhắm vào công ty nghiên cứu AI của Mỹ kể từ đầu năm nay. Các mục tiêu khác bao gồm nhà nghiên cứu Jason Wei vào ngày 22 tháng 9, Nhà khoa học trưởng Jakub Pachocki vào tháng 6 năm 2024 và CTO Mira Murati vào tháng 6 năm 2023.