谷歌人工智能研究实验室 DeepMind 表示,其新发布的人工智能模型 Gemini 2.0 将成为构建更先进的人工智能代理的基石。
谷歌 DeepMind 首席执行官德米斯·哈萨比斯 (Demis Hassabis) 和首席技术官 Koray Kavukcuoglu 在 12 月 11 日的博客文章中表示,12 月 11 日发布的由 Gemini 2.0 驱动的人工智能代理可以理解复杂的指令、计划、推理、跨网站采取行动,甚至可以协助制定视频游戏策略。
“人工智能代理的实际应用是一个充满令人兴奋的可能性的研究领域,”哈萨比斯和卡武克库奥格鲁说。
“我们正在通过一系列原型探索这一新领域,这些原型可以帮助人们完成任务并完成工作。”
根据哈萨比斯和卡夫克乔格的说法,有几个实验性的Gemini驱动的人工智能助手项目,所有这些项目都有不同的功能设想。
一个名为深度研究的项目可以通过搜索网络来帮助用户探索复杂主题,制定多步骤的研究计划,然后生成关于其发现的详细报告。
阿斯特拉计划是一个通用的人工智能助手,旨在处理日常任务,比如根据用户提供的提示提供建议和意见,例如如何洗衣服或获取有关地标的更多信息。
海洋计划专注于创建一个可以控制您的Chrome浏览器的人工智能代理,移动光标,点击按钮,填写表格并导航网站。
根据哈萨比斯和卡夫克乔格的说法,这些项目“仍处于早期开发阶段”,但他们希望在测试和进一步开发后“将它们在未来广泛应用于产品中”。
“虽然还很早,但海洋计划显示在浏览器内导航在技术上变得可行,尽管今天并不总是准确且完成任务速度较慢,但随着时间的推移,这将迅速改善。”
同时,朱尔斯计划正在开发作为开发者的助手,可以直接集成到GitHub工作流程中,帮助处理编码和规划等任务。
哈萨比斯和卡夫克乔格表示,他们还使用Gemini 2.0为视频游戏构建了代理,这些代理可以在实时对话中为玩家提供下一步的建议,并在线搜索“丰富的游戏知识”。
“我们正在与领先的游戏开发商如Supercell合作,探索这些代理是如何工作的,测试它们在各种游戏中解释规则和挑战的能力,从策略游戏到农业模拟器,”他们说。
11月,美国云计算软件公司Salesforce的首席执行官马克·贝尼奥夫表示,人工智能的未来在于自主代理,而不是大型语言模型(LLMs)。
“我实际上认为我们现在正在达到大型语言模型的上限,”他在11月23日《华尔街日报》的“未来一切”播客中说道。
英伟达也在专注于在这一趋势面前定位自己。
“我们看到人工智能原生公司的数量继续增长。当然,我们也开始看到代理人工智能的企业采用,确实是最新的潮流,”英伟达首席执行官黄仁勋在11月的第三季度财报电话会议中说道。
此外,哈萨比斯和卡夫克乔格表示,团队正在“通过机器人技术实验能够在物理世界中提供帮助的代理”。谷歌的人工智能代理目前仅向测试人员和开发者发布。
杂志:如何在这轮牛市中挑选加密游戏代币的赢家:Web3游戏玩家