Giám đốc sản phẩm OpenAI, cho biết người dùng nên thử chế độ giọng nói hoặc kết hợp hình ảnh để nâng cao trải nghiệm với ChatGPT.

Trong podcast Hard Fork đầu tuần này, Nick Turley cho biết các mẹo không phải để "tăng tốc độ như tên lửa" khi sử dụng ChatGPT. Tuy nhiên, từ bản ChatGPT dùng mô hình ngôn ngữ lớn GPT-4o về sau được tích hợp các tính năng giúp người dùng rút ngắn thời gian sử dụng theo hướng hiệu quả hơn, thay vì chỉ nhập văn bản.



Giao diện hỏi đáp của ChatGPT trên ứng dụng cho Android.

Thử nghiệm chế độ giọng nói

Tính năng mới của chatbot hỗ trợ 9 loại giọng nói giống con người, được phát triển với sự tham gia của các diễn viên lồng tiếng chuyên nghiệp, có thể thay đổi trong phần cài đặt.

"Đây là cách hoàn toàn khác để tương tác với ChatGPT", Turley nói. "Nó chưa từng tồn tại trên các phiên bản trước, mang lại trải nghiệm chưa từng có so với các công nghệ tương tự trước đây".

Hiện phiên bản ChatGPT miễn phí dùng giọng nói tiêu chuẩn. Trong khi đó, chế độ nâng cao với các cuộc trò chuyện tự nhiên hơn theo thời gian thực có trên bản thu phí Plus và Team.


Yêu cầu ChatGPT ghi nhớ

Nếu không thích lặp đi lặp lại thông tin, người dùng có thể yêu cầu ChatGPT ghi nhớ một số điều về bản thân và là dữ liệu để AI của OpenAI cải thiện phản hồi trong tương lai.

"Bạn không cần chờ đợi nó suy luận về bạn", Turley nói. "Bạn có thể chỉ cần nói cho nó những thứ bạn muốn nó ghi nhớ".

Turley bổ sung rằng người dùng có thể "tạo ký ức" cho ChatGPT bằng cách yêu cầu ghi nhớ về công việc, tình hình gia đình, sở thích, món ăn yêu thích... Bằng cách này, "trí nhớ" của AI ngày càng cải thiện. Nếu không cần, người dùng có thể tắt tính năng bằng câu lệnh, hoặc thậm chí yêu cầu AI quên chúng đi.


Tạo GPT tùy chỉnh

Theo Turley, người dùng cũng có thể cân nhắc tạo một phiên bản GPT tùy chỉnh của riêng mình. "Mọi người làm điều này vì nhiều lý do", ông nói. "Nếu bạn cần một lời nhắc sử dụng lại nhiều lần, hãy tạo một GPT cho riêng mình".

Trên ChatGPT, người dùng có thể điều chỉnh để AI này tập trung vào nhiệm vụ cụ thể, từ học ngôn ngữ đến phân tích dữ liệu dựa trên hướng dẫn của người dùng thông qua tính năng GPT Builder. Bên cạnh đó, người dùng cũng có thể cấu hình GPT với các cài đặt bổ sung như phân tích dữ liệu nâng cao, thêm mô hình tạo ảnh Dall-E Image Generation.

"Nó rất dễ, chỉ mất vài giây", Turley nói.


Tải tập tin lên

Turley đánh giá tính năng tải tập tin lên ChatGPT ít được biết đến nhưng trải nghiệm "rất tuyệt vời". Hiện có sẵn cho người dùng Plus và Enterprise, chức năng này cho phép người dùng tải lên bất kỳ tệp văn bản, tài liệu, bảng tính và bài thuyết trình nào.

ChatGPT sau đó phân tích văn bản này và đưa ra bản tóm tắt hoặc phản hồi, trích xuất thông tin hoặc trích dẫn cụ thể, cũng như so sánh và đối chiếu hai tài liệu. Nó đặc biệt hữu ích nếu người dùng đang cần xem qua một bài viết dài hoặc dữ liệu cần xử lý ngay trong một tài liệu hàng chục trang.

"Nhiều người không biết tính năng này tồn tại", ông nói. "Nó thực sự, thực sự mạnh mẽ".


Kết hợp hình ảnh

"Tôi thấy có những người thích văn bản, và cũng có những người thích hình ảnh. Tuy nhiên, sự giao thoa giữa hai yếu tố ít xảy ra trên cùng một người dùng", Turley nói.

Đại diện OpenAI nói ông mong muốn có nhiều "sự giao thoa" hơn vì ChatGPT hỗ trợ cả hai. Bên cạnh văn bản, chatbot này cũng có thể hiểu và diễn giải hình ảnh.

Hiện tại, trình tạo hình ảnh Dall-E của OpenAI cũng có sẵn trong ChatGPT, có thể tạo ảnh từ cuộc trò chuyện. Người dùng có thể kết hợp để tăng trải nghiệm sử dụng hoặc sáng tạo từ đó, chẳng hạn làm một tấm thiệp sinh nhật. "Bạn có thể muốn sử dụng cả hai: một hình ảnh nhỏ kèm một bài thơ dễ thương", ông nói thêm.

$WLD $SOL $BTC