Google đã cung cấp tính năng chatbot AI hỗ trợ giọng nói, Gemini Live, miễn phí cho tất cả người dùng Android. Tính năng này cho phép người dùng nói chuyện với AI Chatbot của Google thông qua lệnh thoại, trước đây đã có sẵn hoàn toàn cho những người đăng ký Gemini Advanced.

Tính năng mới cho phép tất cả người dùng Android sử dụng các chức năng đối thoại của chatbot, hiện bao gồm cả việc đặt câu hỏi bằng giọng nói và ngắt lời câu trả lời trong quá trình này.

Thông báo này được đưa ra sau lần ra mắt đầu tiên của ứng dụng Gemini Live vào tháng trước tại sự kiện Pixel 9 của Google. Người dùng Android hiện có thể dễ dàng kích hoạt tính năng này trực tiếp bằng cách nhấn vào biểu tượng dạng sóng trong ứng dụng Gemini, cho phép họ bắt đầu sử dụng tương tác bằng giọng nói với AI. Việc triển khai diễn ra vào thời điểm tính năng cạnh tranh của Open AI, Advanced Voice Mode cho ChatGPT vẫn chưa được triển khai hoàn toàn.

Người dùng hiện có thể truy cập chế độ giọng nói của Gemini với nhiều quyền kiểm soát hơn

Chức năng đáng chú ý nhất của Gemini Live bao gồm khả năng cho phép người dùng đặt câu hỏi thành tiếng, ngắt lời phản hồi giữa câu và chọn giọng nói khác nhau cho câu trả lời của AI. Tính năng rảnh tay này bổ sung một số mức độ linh hoạt và cá nhân hóa, giúp các cuộc trò chuyện với AI trở nên trôi chảy và phản hồi nhanh hơn. Ngoài việc quản lý cuộc thảo luận theo thời gian thực, những người tham gia cũng có thể "giữ" câu trả lời hoặc "kết thúc" cuộc trò chuyện bất cứ lúc nào khi cần.

Mặc dù ban đầu, khả năng điều khiển bằng giọng nói là một tính năng của dịch vụ trả phí, nhưng tính năng điều khiển bằng giọng nói này hiện đã có trong phiên bản miễn phí của ứng dụng Gemini. Người dùng Android có thể bắt đầu sử dụng ứng dụng hoặc lớp phủ để có quyền truy cập ngay lập tức. Hiện tại, chế độ giọng nói chỉ được tối ưu hóa để hỗ trợ tiếng Anh, tuy nhiên, Google đã xác nhận kế hoạch thêm nhiều ngôn ngữ hơn và cung cấp tính năng này trên các thiết bị iOS mặc dù không có mốc thời gian chính xác nào được đưa ra.

Google ra mắt Gemini Live khi tính năng giọng nói của OpenAI tụt hậu

Thời điểm ra mắt này đưa Google lên trước OpenAI, công ty đã công bố Advanced Voice Mode cho ChatGPT vào tháng 5. Tuy nhiên, tính năng này do Open AI cung cấp vẫn chưa được cung cấp rộng rãi, đã có sẵn ở mức hạn chế kể từ cuối tháng 7. Những người trong ngành khác còn cho rằng thời gian chờ đợi dài có thể là do cần có sức mạnh tính toán cao để hỗ trợ tương tác AI dựa trên giọng nói, đặc biệt là trên quy mô lớn.

Động thái của Google khi ra mắt Gemini Live miễn phí trái ngược với việc OpenAI phát hành một tính năng tương tự theo từng đợt. Trong khi OpenAI tiếp tục phát triển chiến lược để áp dụng rộng rãi hơn, thì việc Google phát hành Gemini Live đến tay những người dùng muốn tương tác với AI bằng cách nói thay vì nhập liệu, tạo nên lợi thế cạnh tranh giữa hai công ty.

Hiện tại, Gemini Live có thể truy cập được trên các thiết bị Android và Google có kế hoạch bổ sung thêm nhiều chức năng hơn khi phát triển dịch vụ.