翻译:白话区块链
对许多人来说,未来的 AI 代理就像是漫威电影宇宙中的角色 J.A.R.V.I.S.。
J.A.R.V.I.S.,全称为“Just A Rather Very Intelligent System”(仅仅是一个相当智能的系统),最初是由托尼·斯塔克(Tony Stark)——一个虚构的工业家和杰出的投资者——创造的自然语言计算机系统。后来,它成为了一个 AI 系统,作为斯塔克的助手。更久之后,J.A.R.V.I.S. 获得了一个合成身体,变成了机器人“幻视”(Vision)。
尽管 AI 代理——自主和半自主的生成式 AI 系统,能够独立执行行动——可能离拥有实体的能力还很远,但它们有可能在明年某个时刻接近甚至超越 J.A.R.V.I.S.。
2024 年下半年,AI 代理的流行增长与 2022 年 ChatGPT 和其他生成式 AI 系统迅速崛起并改变 AI 市场的情形相似。供应商似乎从开发最新的大型语言模型(LLMs)和 AI 聊天机器人,迅速转向创建代理和行动模型。
例如,Salesforce 在去年秋季推出了 Agentforce,一款低代码的代理构建工具。微软推出了 AI Agents Service,这是一个帮助开发者构建 AI 代理的社区平台。
其他供应商也已将 AI 代理引入企业,自动化各种业务流程。分析公司 Forrester Research 列出了目前有 400 家供应商正在构建代理。
“Forrester Research 的分析师 Craig Le Clair 说:“目前对它们的兴奋情绪非常高。’”他说:“但也存在一定的风险,因为你正在释放一个可以在没有人工检查和平衡的情况下自动执行的自动化过程。”
兴奋与风险并存,意味着 AI 专家和供应商对 2025 年的 AI 代理有着很高的期待。
1、通过真实应用消除混淆
其中一个期待是,尽管 2024 年为 AI 代理奠定了基础,但 2025 年将是 AI 代理迎接企业准备的一年,AI 市场专家表示。
这意味着,围绕代理的混淆将消失,Responsive 的联合创始人兼 CIO AJ Sunder 说道,他是一家 AI 驱动的提案与回应软件供应商。
“代理与自动化、代理与 RPA(机器人过程自动化)之间有很多混淆,”Sunder 说。“这些混淆大部分会消失。然后我们就会开始看到更多的代理被部署,并在现实世界中使用。”
RPA 使用机器人或机器人来自动化重复任务,而不依赖 AI,代理则涉及 AI 技术。RPA 是确定性的和可预测的,而代理则不是。
“它们的相似之处在于,它们都是数字化的同事,”Le Clair 说道。“只不过,当你在数字同事中加入 AI 时,我们就称其为 AI 代理,它更智能,能理解上下文,知道如何避免卡壳。”
Sunder 说,代理的一些实际应用将会出现在客户服务中;其他的则会出现在金融或欺诈检测中。
“任何复杂的任务,都需要 AI 记忆、计划和执行多步骤、复杂的任务,我认为代理会在其中发挥巨大的作用,”Sunder 说。
其中一个复杂的应用是视频创作。
“很多这些代理 AI 解决方案实际上可以以一种方式部署,协助视频创作过程,”Colossyan(一家 AI 视频平台)的研究主管 Shahzaib Aslam 说。
AI 代理可以帮助制作一个引人入胜的视频,提供有说服力的论据,并包括行动号召,鼓励客户采取行动,如购买产品,Aslam 说。
“这变成了一个非常强大的工具,因为它将帮助你制作一个更具参与感、成功率更高的视频,”他说。
代理不仅将在视频创作等不同应用场景中发挥作用,许多人还将开始使用它们来解决规模化的问题,Gartner 分析师 Tom Coshow 说道。
然而,AI 代理的应用和使用有不同的层次,佩佳系统(Pegasystems)工作流自动化和决策供应商的 AI 实验室主任及首席科学家 Peter van der Putten 说道。
他表示,在应用的一个极端,AI 代理可以读取、整合并综合信息,得出一定结论,但不会采取任何行动。另一端则是,AI 代理根据它所综合的信息采取行动。
“代理的真正成功并不在于这些代理自身的智能能力,而在于它们如何被嵌入到实际应用中,”他说。
然而,他继续表示,大多数企业在看到 AI 代理的价值之前,必须先进行尝试。
“有时我甚至会对这些系统能够做的事情感到惊讶,”van der Putten 说道。“了解这一点的唯一方法就是通过安全的实验。”
2、更好的推理模型
另一个关于 AI 代理的预期是,大型语言模型(LLM)将继续作为它们的大脑。这意味着 LLM 需要在推理方面变得更强,以便 AI 代理能够更好地执行其任务。
Aslam 说,链式思维提示(chain of thought prompting)已经展示了这一点。
这个概念是,模型不仅仅为一个问题生成一个回答,而是生成多个回答,并通过一系列步骤来推理,最终得出答案。
尽管这可能会比较昂贵,因为企业需要运行多个推理来生成链式思维,但它也使得模型的推理能力得到了提升,Aslam 说道。
他补充道,这将是 AI 行业和学术界在 2025 年将要深入研究的领域。
“这种在模型中加入可解释性的方式是非常有意义的,我们将看到更多的工作和研究投入到这一方向,即在推理时扩大计算规模,并使模型以系统化和推理的方式得出预测,而不仅仅是简单地生成内容,”他继续说道。
3、特定任务代理
虽然到 2025 年可能会出现更多代理型应用场景,但这并不会消除对人工干预的需求。
然而,随着 AI 代理带来新的自动化水平,关于工作岗位会被取代的恐惧依然存在。
行业中有些人表示,尽管到 2025 年 AI 代理将具备一定的自治能力,但不会是完全自治。换句话说,AI 代理将执行某个个人工作的一部分,但不会接管整个工作。例如,AI 代理可能会帮助你找到想要使用的旅行社的联系方式,但它无法完成整个预定流程。
"我们会看到代理不是完全独立地接管整个工作岗位,而是会承担一个人的部分责任或一个流程的部分,然后与传统自动化系统、人工协作以及其他代理共同工作", UiPath 高级副总裁兼总经理 Mark Greene 说道。
那些接管责任一部分的代理将是专业化的,并以单一的方式完成任务。这将使得 AI 代理在完成任务时更加精准,Greene 说道。
"责任越明确,就越能衡量其效果", 他说。
4、AI 代理的基础设施
除了单任务 AI 代理的崛起,2025 年也可能成为构建 AI 代理基础设施的一年,Futurum Group 分析师 Olivier Blanchard 说道。
要让 AI 代理能够与其他代理进行沟通,甚至与人类协同执行任务,需要一个协调层,Blanchard 说。
"2025 年不会是我们看到完全成熟的代理型 AI 的一年," 他说。"2025 年是我们为其构建基础设施的一年,构建它的基础框架。"
他补充说,可能在帮助构建这些基础设施的供应商包括像高通、英特尔和 AMD 这样的芯片制造商。
"高通的处理器将主要用于设备上的代理型 AI," Blanchard 继续说道。与此同时,英伟达的处理器目前则更多地用于云端与代理型 AI 的协作。
"英伟达的 GPU 已经被广泛应用于训练 AI 模型,这为未来的代理型 AI 层奠定了基础," 他说。"两年后,代理型 AI 将是云端和设备端软件的混合,彼此协同工作。"
目前,英伟达主要与云端合作,而高通则主要专注于设备端。另一方面,像苹果和三星这样的设备制造商将参与创建协调层,使得代理型 AI 能够跨平台、跨设备和跨应用程序进行协同工作,Blanchard 说道。
"我们已经具备了这些基础," Blanchard 说。"我们缺少的,是一种能够'做所有事'的系统。"
5、迈向协调层的方式之一是多模态 AI
虽然像 ChatGPT 这样的生成型 AI 系统具备输入输出功能,但它们无法代表人类连接到其他应用程序。
然而,随着多模态 AI 的发展和成熟,能够使图像输入生成视频输出,这将促进代理型 AI 更好地工作。
"随着模型变得更智能,我们的代理也会变得更智能," Coshow 说道。
Blanchard 说,AI 代理需要一个可以跨平台和设备工作的协调层。协调层由能够让 AI 代理从一个平台或界面切换到另一个平台或界面的链接组成,或者从一个应用程序切换到下一个应用程序。
如果高通建立了自己的协调层,AMD 也建立了自己的协调层,这将使得代理型 AI 的互操作性成为一大挑战。
"如果所有芯片制造商都在使用各自的协调层,它们不一定能够很好地进行互相沟通," Blanchard 说。
6、2025年代理型AI面临的挑战
与其他AI技术类似,代理型AI在2025年也将面临一系列挑战。其中之一是数据问题。
由于数据通常分散在不同的来源和过程之间,给代理型AI提供执行任务所需的数据可能会变得非常具有挑战性,Greene表示。
另一个问题是缺乏有关代理自动化设计过程的知识,Greene补充道。
例如,行业需要了解何时应当由人类与代理型AI互动、如何进行互动,以及应该通过哪些渠道与代理型AI进行沟通,他说。
还有一个挑战是信任问题,Sunders表示。
"如果底层技术仍然依赖生成型AI和大型语言模型,那么这些缺点也将被代理型AI继承,"他说。
尽管面临这些障碍,Sunders认为,2025年将是代理型AI的重要一年。
"我们将弄清楚代理型AI在哪些场景中是有意义的,如何部署它们,如何赢得信任,然后再完全放手,"他说。"这个它可以完全自主的承诺,我认为它最终会实现;但是否会在2025年实现,我认为不太可能。"