Model kecerdasan buatan Google, Gemini, semakin menyatu dengan sebagian besar teknologi raksasa teknologi tersebut, dan AI akan segera muncul di Gmail, YouTube, dan ponsel pintar perusahaan.

Dalam pidato utama di konferensi pengembang I/O 2024 perusahaan pada tanggal 14 Mei, CEO Sundar Pichai mengungkapkan beberapa lokasi mendatang yang akan menampilkan model AI-nya.

Pichai menyebut AI sebanyak 121 kali dalam keynote-nya yang berdurasi 110 menit saat topik tersebut menjadi pusat perhatian — Gemini, yang diluncurkan pada bulan Desember, menjadi pusat perhatian.

Google menggabungkan model bahasa besar (LLM) ke dalam hampir semua penawarannya, termasuk Android, Penelusuran, dan Gmail, dan inilah yang dapat diharapkan pengguna di masa mendatang.

Sundar Pichai di Google I/O 2024. Sumber: Interaksi Aplikasi Google

Gemini mendapatkan lebih banyak konteks karena dapat berinteraksi dengan aplikasi. Dalam pembaruan yang akan datang, pengguna akan dapat memanggil Gemini untuk berinteraksi dengan aplikasi seperti menyeret dan melepaskan gambar yang dihasilkan AI ke dalam pesan.

Pengguna YouTube juga dapat mengetuk “Tanyakan video ini” untuk menemukan informasi spesifik dari dalam video dari AI.

Gemini di Gmail

Platform email Google, Gmail, juga mendapatkan integrasi AI karena pengguna dapat mencari, meringkas, dan menyusun email mereka menggunakan Gemini.

Asisten AI akan dapat mengambil tindakan pada email untuk tugas yang lebih kompleks, seperti membantu memproses pengembalian e-commerce dengan mencari di kotak masuk, menemukan tanda terima, dan mengisi formulir online.

Gemini Langsung

Google juga meluncurkan pengalaman baru yang disebut Gemini Live di mana pengguna dapat melakukan obrolan suara “mendalam” dengan AI di ponsel cerdas mereka.

Chatbot dapat disela saat menjawab untuk klarifikasi dan akan beradaptasi dengan pola bicara pengguna secara real-time. Selain itu, Gemini juga dapat melihat dan merespons lingkungan fisik melalui foto atau video yang diambil di perangkat.

Tangkapan layar dari video promosi Gemini. Sumber: Kemajuan Multimodal Google

Google sedang berupaya mengembangkan agen AI cerdas yang dapat mempertimbangkan, merencanakan, dan menyelesaikan tugas multi-langkah yang kompleks atas nama pengguna di bawah pengawasan. Multimodal berarti AI dapat melampaui teks dan menangani input gambar, audio, dan video.

Contoh dan kasus penggunaan awal mencakup otomatisasi pengembalian belanja dan penjelajahan kota baru.

Terkait: Gemini 'Pembunuh GPT-4' Google telah keluar, berikut cara mencobanya

Pembaruan lain yang sedang direncanakan untuk model AI perusahaan termasuk penggantian Asisten Google di Android dengan Gemini yang terintegrasi penuh ke dalam sistem operasi seluler.

Fitur baru “Tanya Foto” memungkinkan pencarian perpustakaan foto menggunakan pertanyaan bahasa alami yang didukung oleh Gemini. Ia dapat memahami konteks, mengenali objek dan orang, dan merangkum kenangan foto sebagai jawaban atas pertanyaan.

Ringkasan tempat dan area yang dihasilkan AI akan ditampilkan di Google Maps dengan memanfaatkan wawasan dari data pemetaan platform.

Majalah: 'Sic AI satu sama lain' untuk mencegah kiamat AI: David Brin, penulis fiksi ilmiah