Foresight News 消息,據 Google 官方博客,谷歌發佈新一代人工智能模型 Gemini 2.0。Gemini 2.0 支持文本、圖像、視頻、音頻等多模態輸入,具備原生圖像生成、多語言文本轉語音(TTS)等多模態輸出功能。相較 Gemini 1.5 Pro,模型速度提升至兩倍,並優化多模態推理、複雜指令執行和工具使用能力,支持調用 Google 搜索、代碼執行和第三方功能。實驗版本 Gemini 2.0 Flash 現已向開發者開放,2025 年 1 月將全面推廣多模態功能,並推出多模態實時 API,爲開發者提供更多應用支持。