Google Unveils Gemini 2.0 Flash AI Model, Now Accessible To Developers

科技公司谷歌宣佈推出Gemini 2.0,這是其Gemini系列中的最新AI模型,首先推出名爲Gemini 2.0 Flash的實驗版本。

在Gemini 1.5 Flash取得成功的基礎上,Gemini 2.0 Flash 提供了更好的性能,同時保持快速響應時間。值得注意的是,新型號在關鍵基準測試中以兩倍速度超越了1.5 Pro。此外,Gemini 2.0 Flash引入了擴展功能,包括對多模態輸入(如圖像、視頻和音頻)的支持,以及與AI生成的圖像和可調多語言文本到語音(TTS)音頻配對的多模態輸出。該AI模型還可以原生調用工具,如Google搜索、執行代碼和訪問用戶定義的第三方功能。

目前可通過Google AI Studio和Vertex AI的Gemini API向開發者提供,2.0 Flash的實驗版本支持文本輸出的多模態輸入。高級功能如文本到語音和原生圖像生成對早期訪問合作伙伴可用,預計在1月份會有更廣泛的可用性,屆時還將推出更多模型規模。

爲了進一步支持開發者創建動態、互動的應用程序,谷歌還推出了新的多模態實時應用程序編程接口(API)。該API允許實時音頻和視頻流輸入,以及集成多種工具以實現組合功能的能力。

從今天開始,全球用戶可以通過在桌面和移動網頁平臺上從模型下拉菜單中選擇,嘗試Gemini 2.0 Flash的實驗性聊天優化版本。該模型也將在不久的將來在Gemini移動應用程序上提供。

谷歌通過研究項目探索Gemini 2.0 Flash的能力

Gemini 2.0 Flash引入了增強用戶交互的先進能力,包括多模態推理、長上下文理解、複雜指令處理、規劃、組合函數調用和與本地工具的無縫集成。這些功能結合改進的延遲,共同爲新一代自主AI體驗奠定基礎。

目前,谷歌正在研究AI代理如何通過旨在提高生產力和簡化工作流程的原型幫助人們完成現實世界的任務。示例包括更新後的Astra項目,一個專注於通用AI助手潛在能力的研究計劃,新項目Mariner重新構想人類與代理的互動,從基於瀏覽器的體驗開始,以及Jules,一個旨在支持開發者工作的AI驅動編碼助手。通過在這些項目中利用Gemini 2.0 Flash,谷歌能夠有效評估其能力並取得更好的成果,突顯了新模型的巨大潛力。

谷歌發佈Gemini 2.0 Flash AI模型,現已向開發者開放的文章首發於Metaverse Post。