Mô hình trí tuệ nhân tạo Gemini của Google đang được tích hợp vào phần lớn công nghệ của gã khổng lồ công nghệ, với AI sẽ sớm xuất hiện trong Gmail, trên YouTube và trên điện thoại thông minh của công ty.

Trong bài phát biểu quan trọng tại hội nghị nhà phát triển I/O 2024 của công ty vào ngày 14 tháng 5, CEO Sundar Pichai đã tiết lộ một số địa điểm sắp tới mà mô hình AI của họ sẽ xuất hiện.

Pichai đã đề cập đến AI 121 lần trong bài phát biểu dài 110 phút của mình khi chủ đề này chiếm vị trí trung tâm - Gemini, ra mắt vào tháng 12, đã thu hút sự chú ý.

Google đang kết hợp mô hình ngôn ngữ lớn (LLM) vào hầu như tất cả các dịch vụ của mình, bao gồm Android, Tìm kiếm và Gmail và đây là những gì người dùng có thể mong đợi trong tương lai.

Sundar Pichai tại Google I/O 2024. Nguồn: Tương tác với ứng dụng Google

Gemini đang có nhiều bối cảnh hơn để có thể tương tác với các ứng dụng. Trong bản cập nhật sắp tới, người dùng sẽ có thể gọi cho Gemini để tương tác với các ứng dụng như kéo và thả hình ảnh do AI tạo vào tin nhắn.

Người dùng YouTube cũng có thể nhấn vào “Hỏi video này” để tìm thông tin cụ thể trong video từ AI.

Song Tử trong Gmail

Nền tảng email của Google, Gmail, cũng đang được tích hợp AI vì người dùng sẽ có thể tìm kiếm, tóm tắt và soạn thảo email của họ bằng Gemini.

Trợ lý AI sẽ có thể thực hiện hành động đối với email cho các tác vụ phức tạp hơn, chẳng hạn như hỗ trợ xử lý trả lại thương mại điện tử bằng cách tìm kiếm hộp thư đến, tìm biên nhận và điền vào biểu mẫu trực tuyến.

Song Tử sống

Google cũng tiết lộ một trải nghiệm mới có tên Gemini Live, nơi người dùng có thể trò chuyện thoại “chuyên sâu” với AI trên điện thoại thông minh của họ.

Chatbot có thể bị gián đoạn giữa câu trả lời để làm rõ và nó sẽ thích ứng với kiểu giọng nói của người dùng trong thời gian thực. Ngoài ra, Gemini cũng có thể nhìn và phản hồi với môi trường xung quanh thông qua ảnh hoặc video được quay trên thiết bị.

Ảnh chụp màn hình từ video quảng cáo của Gemini. Nguồn: Những tiến bộ đa phương thức của Google

Google đang nỗ lực phát triển các tác nhân AI thông minh có thể suy luận, lập kế hoạch và hoàn thành các nhiệm vụ nhiều bước phức tạp thay mặt người dùng dưới sự giám sát. Đa phương thức có nghĩa là AI có thể vượt ra ngoài văn bản và xử lý các đầu vào hình ảnh, âm thanh và video.

Các ví dụ và trường hợp sử dụng ban đầu bao gồm tự động trả lại hàng khi mua sắm và khám phá một thành phố mới.

Liên quan: Gemini 'sát thủ GPT-4' của Google đã ra mắt, đây là cách bạn có thể dùng thử

Các bản cập nhật khác đang được triển khai cho mô hình AI của công ty bao gồm việc thay thế Google Assistant trên Android bằng Gemini được tích hợp hoàn toàn vào hệ điều hành di động.

Tính năng “Hỏi Ảnh” mới cho phép tìm kiếm thư viện ảnh bằng các truy vấn ngôn ngữ tự nhiên do Gemini cung cấp. Nó có thể hiểu bối cảnh, nhận biết đồ vật và con người cũng như tóm tắt những kỷ niệm bằng hình ảnh để trả lời các câu hỏi.

Bản tóm tắt về các địa điểm và khu vực do AI tạo ra sẽ được hiển thị trên Google Maps bằng cách sử dụng thông tin chi tiết từ dữ liệu bản đồ của nền tảng.

Tạp chí: ‘Sic AI chồng chéo lên nhau’ để ngăn chặn ngày tận thế AI: David Brin, tác giả khoa học viễn tưởng