PANews 12 Desember, berita dari Google resmi, Google meluncurkan model kecerdasan buatan generasi baru Gemini 2.0. Gemini 2.0 mendukung masukan multimodal seperti teks, gambar, video, dan audio, serta memiliki kemampuan keluaran multimodal seperti generasi gambar asli dan teks ke suara multibahasa (TTS). Dibandingkan dengan Gemini 1.5 Pro, kecepatan model meningkat hingga dua kali lipat, dan telah mengoptimalkan inferensi multimodal, pelaksanaan instruksi kompleks, dan kemampuan penggunaan alat, mendukung pemanggilan pencarian Google, eksekusi kode, dan fungsi pihak ketiga.

Versi percobaan Gemini 2.0 Flash kini telah dibuka untuk pengembang, pada Januari 2025 akan memperkenalkan fungsi multimodal secara penuh, dan meluncurkan API waktu nyata multimodal untuk memberikan lebih banyak dukungan aplikasi kepada pengembang.