Foresight News 消息,据 Google 官方博客,谷歌发布新一代人工智能模型 Gemini 2.0。Gemini 2.0 支持文本、图像、视频、音频等多模态输入,具备原生图像生成、多语言文本转语音(TTS)等多模态输出功能。相较 Gemini 1.5 Pro,模型速度提升至两倍,并优化多模态推理、复杂指令执行和工具使用能力,支持调用 Google 搜索、代码执行和第三方功能。实验版本 Gemini 2.0 Flash 现已向开发者开放,2025 年 1 月将全面推广多模态功能,并推出多模态实时 API,为开发者提供更多应用支持。