Odaily星球日报讯 北京时间 5 月 15 日凌晨,谷歌 I/O 开发者大会主题演讲上,谷歌 CEO 桑达尔·皮查伊(Sundar Pichai)发布数十款 Google 和 AI 结合产品,堪称“全家桶”级别,全力对战 OpenAI,其中包括支持 200 万 token 长文本的 Gemini 1.5 Pro 和 Gemini 1.5 Flash、谷歌版 Sora 技术 Veo,最强开源模型 Gemma 2,支持生成式搜索的 AI Overviews、第六代 TPU 等。 但最受关注的还是谷歌 DeepMind CEO、谷歌 AI 负责人 Demis Hassabis 公布的真正通向 AGI 的万能助手项目 Project Astra,以及语音 NotebookLM,直接对标 GPT-4o。 大会主题演讲中,谷歌发了一段非常惊艳的 AI 助手演示,这次还了发誓,没有以任何方式伪造或篡改。 Demis 表示,Project Astra 是自己期待了几十年的 AI 助手的雏形,是通用 AI 的未来。据悉,Project Astra 是一个实时、多模式的 AI 助手,通过接收信息、记住它所看到的内容、处理该信息和理解上下文细节来与周围的世界进行交互,它的语音交互比当前形式的 Google Assistant 更自然,没有延迟或延迟,可以回答问题或帮助你做几乎任何事情。 从演示看,Project Astra 可以很快处理收到的信息,可以通过连续编码视频帧并将视频和语音组合成事件时间线来做到这一点,然后缓存信息以供回忆。谷歌表示,其中一些功能将在今年晚些时候添加到 Gemini 应用程序和其他产品中。 除了 Project Astra 之外,谷歌还推出基于 Gemini 的多款通用 AI Agent 子系列产品,包括音频 NotebookLM、音乐的 Music AI Sandbox、视频的 Veo、图像的 Imagen 3,直接对标 OpenAI 发布的 GPT-4o、Dall-E 和 Sora。(钛媒体)