OpenAI Expands ChatGPT Voice Assistant to Paid Users

Cryptopolitan · 2024-09-24T21:43:01.000Z

OpenAI is rolling out its highly anticipated voice assistant feature, known as “advanced voice mode,” to all paid ChatGPT users. First released in May 2024, this new feature is currently available for ChatGPT Plus and Team users, with Enterprise and Edu users to follow next week. The release comes as OpenAI continues to improve its AI-based chatbot. Advanced Voice is rolling out to all Plus and Team users in the ChatGPT app over the course of the week.While you’ve been patiently waiting, we’ve added Custom Instructions, Memory, five new voices, and improved accents.It can also say “Sorry I’m late” in over 50 languages. pic.twitter.com/APOqqhXtDg — OpenAI (@OpenAI) September 24, 2024 Although the company introduced the voice feature at a product launch event in May, the company had to delay the official launch of the feature because of safety issues. In June, the company delayed the feature due to possible problems, especially if the request was a voice impersonation or some copyrighted material. By July, only a few users of the ChatGPT Plus paid subscription service had used the tool. OpenAI has since put in place measures such as filters to ensure that the generated music or any other copyrighted audio is not produced. OpenAI enhances voice assistant with more options and features In addition to the general availability, OpenAI has also expanded the range of voice options for the assistant up to nine. Some of the names are nature-inspired, such as Arbor, Spruce, and Maple. This variety helps the user to select the kind of voice they prefer using. However, there are still some limitations. For example, it lacks the computer vision that was demonstrated earlier this year when people were able to get verbal directions on physical movements such as dancing through their smartphone cameras. Some of these features are not yet included in this release. Among the key priorities that have been taken into consideration during the design of the assistant is the capability of the voice assistant to mimic some people’s speech. In its statement, OpenAI has noted that the system cannot mimic human beings when it comes to deepfake technology and voice synthesis, given the ethical questions surrounding such technology. As noted in our earlier post, hackers recently gained access to the OpenAI press account and shared a phishing link that promised “OPENAI” tokens to ChatGPT users. This is the fourth instance of cyber attacks linked to the company’s X account and the fifth cyber attack targeting the American AI research firm since the beginning of this year. Other targets include researcher Jason Wei on September 22, Chief Scientist Jakub Pachocki on June 2024, and CTO Mira Murati on June 2023.

OpenAI đang triển khai tính năng trợ lý giọng nói rất được mong đợi, được gọi là "chế độ giọng nói nâng cao", cho tất cả người dùng ChatGPT trả phí.
Được phát hành lần đầu tiên vào tháng 5 năm 2024, tính năng mới này hiện có sẵn cho người dùng ChatGPT Plus và Team, với người dùng Enterprise và Edu sẽ theo sau vào tuần tới. Bản phát hành này diễn ra khi OpenAI tiếp tục cải thiện chatbot dựa trên AI của mình.
Advanced Voice sẽ được triển khai cho tất cả người dùng Plus và Team trong ứng dụng ChatGPT trong tuần này. Trong khi bạn kiên nhẫn chờ đợi, chúng tôi đã thêm Hướng dẫn tùy chỉnh, Bộ nhớ, năm giọng nói mới và cải thiện giọng nói. Nó cũng có thể nói "Xin lỗi, tôi đến muộn" bằng hơn 50 ngôn ngữ. pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI) ngày 24 tháng 9 năm 2024
Mặc dù công ty đã giới thiệu tính năng giọng nói tại sự kiện ra mắt sản phẩm vào tháng 5, nhưng công ty đã phải hoãn việc ra mắt chính thức tính năng này vì các vấn đề an toàn. Vào tháng 6, công ty đã hoãn tính năng này do có thể có vấn đề, đặc biệt là nếu yêu cầu là giả giọng nói hoặc một số tài liệu có bản quyền.
Đến tháng 7, chỉ một số ít người dùng dịch vụ đăng ký trả phí ChatGPT Plus sử dụng công cụ này. Kể từ đó, OpenAI đã đưa ra các biện pháp như bộ lọc để đảm bảo rằng âm nhạc được tạo ra hoặc bất kỳ âm thanh có bản quyền nào khác không được tạo ra.
OpenAI cải tiến trợ lý giọng nói với nhiều tùy chọn và tính năng hơn
Ngoài tính khả dụng chung, OpenAI cũng đã mở rộng phạm vi tùy chọn giọng nói cho trợ lý lên đến chín. Một số tên được lấy cảm hứng từ thiên nhiên, chẳng hạn như Arbor, Spruce và Maple. Sự đa dạng này giúp người dùng chọn loại giọng nói mà họ thích sử dụng.
Tuy nhiên, vẫn còn một số hạn chế. Ví dụ, nó thiếu tầm nhìn máy tính đã được chứng minh vào đầu năm nay khi mọi người có thể nhận được chỉ dẫn bằng lời về các chuyển động vật lý như nhảy múa thông qua camera điện thoại thông minh của họ. Một số tính năng này vẫn chưa được đưa vào bản phát hành này.
Trong số các ưu tiên chính đã được cân nhắc trong quá trình thiết kế trợ lý là khả năng của trợ lý giọng nói trong việc bắt chước giọng nói của một số người. Trong tuyên bố của mình, OpenAI đã lưu ý rằng hệ thống không thể bắt chước con người khi nói đến công nghệ deepfake và tổng hợp giọng nói, do các câu hỏi về đạo đức xung quanh công nghệ đó.
Như đã lưu ý trong bài đăng trước đó của chúng tôi, tin tặc gần đây đã truy cập được vào tài khoản báo chí OpenAI và chia sẻ một liên kết lừa đảo hứa hẹn mã thông báo "OPENAI" cho người dùng ChatGPT. Đây là lần thứ tư các cuộc tấn công mạng được liên kết đến tài khoản X của công ty và là lần thứ năm các cuộc tấn công mạng nhắm vào công ty nghiên cứu AI của Mỹ kể từ đầu năm nay. Các mục tiêu khác bao gồm nhà nghiên cứu Jason Wei vào ngày 22 tháng 9, Nhà khoa học trưởng Jakub Pachocki vào tháng 6 năm 2024 và CTO Mira Murati vào tháng 6 năm 2023.

Khám phá thêm từ Nhà sáng tạo nội dung

Tin tức mới nhất

Khám phá thêm từ Nhà sáng tạo nội dung

Tin tức mới nhất

Bài viết thịnh hành