作者:jolestar
上周倒腾了一下AI代理,前天参加了ai16z在北京的活动,想看看AI代理现在实际上能干啥,思考一下它未来能干啥。
AI代理的现状让我想起那个梗图,自动售货机里面藏了个人。大家已经想象中的AI代理已经开始拥有自主意识了,但实际上AI代理里面其实藏了个开发者。(这里大家脑补画面,我尝试让AI生成这个图片,发现AI不能理解“藏”)
AI代理框架的基本工作方式
AI代理框架当前扮演一个粘合剂的作用,把client(Twitter,Discord,Telegram等)和各种插件(各链等)粘合起来,然后框架提供一个基础库(记忆存储,会话隔离,上下文生成)等,后面对接各种AI平台接口。
AI代理框架如何和应用以及业务场景结合
从去年AI火爆以来,各种平台和工具涌现,最关键就是要解决一个问题,AI如何和应用结合。有AI平台尝试提供插件的方式,有的打造工作流模型,也有传统应用在应用内嵌入AI的方式。但这里面的关键是:1. 应用的交互入口在哪里?2. AI如何和现有业务逻辑结合。
各AI平台给用户提供的应用的交互入口都是一个类似聊天窗口的对话框,显然大家都认为和AI应用的交互方式应该是一种“拟人”的方式。而这点上AI代理聪明之处在于它直接接入了所有的开放IM以及社交系统,显然比新搞一个更容易接受。
AI如何和现有业务逻辑结合。AI代理提供的方案是让开发者把AI的决策融入到业务场景中。编程语言需要确定性,if的条件只能是true或者false,无法处理模糊的业务逻辑。而通过AI可以将复杂的逻辑转换成精确的条件,然后就可以无缝融入到业务场景中去了。
比如群内回复消息这个功能,传统的IM Bot需要通过一些明确的消息指令才能触发,而通过AI可以实现一个方法shouldReplyMessage,给他上下文,它返回true或false。
AI在业务逻辑场景中的作用主要是:
“意图”发现:通过提示词中的说明,让AI根据上下文发现用户文本消息中的“意图”,把意图映射到具体的代码。
协助决策:通过AI将模糊的复杂条件转换成确定的true/false或者枚举类型,然后结合到业务逻辑中去。
看到这里,很多人可能对AI代理要失望了,很多人以为的AI代理就是教一下AI它就啥都会了。实际上因为大模型的上下文限制的难题,没办法(至少当前)打造一个万能的AI,让它可以干任何事情。但好消息是程序员不用担心失业了,AI后面还是需要藏着大量的程序员,还需要有人来堆if else,但关键的区别是程序可以处理的业务边界在扩展。
两种AI代理
在活动上,问了shaw一个问题,市场对AI代理有两种期望,1. AI代理自己扮演一个角色,有自己的ID,品牌,给用户提供服务。2. 用户有个人AI代理,相当于个人助手,可以协助用户处理一些业务。这两种AI代理哪种会更受欢迎?他觉得两个方向都会不错,也有可能结合起来。
现在市面上大家主要探索的还是第一个方向。这个方向类似于服务AI代理化,未来可能没有App界面了,App都AI代理化了,拟人化了。而第二个方向则是应用客户端的代理化,未来的应用客户端会是助手代理的一个插件,应用本地数据变成了代理记忆库的一部分,同时这个插件也负责和云端的服务代理沟通。而这是一种新的应用架构模式,会改变整个基础设施。
AI代理对基础设施的要求
基础设施要实现无准入门槛(Permissionless),不然AI代理会被各种防攻击策略限制,服务应该用经济成本的方式(Gas)防攻击。这点上开放程度比较差的平台会面临比较大的冲击,当年Web2初期的开放平台热会重新被点燃。
AI代理需要能操作资金来付费,用以解决上面的问题。
也就是说,未来的服务,无论是否是基于区块链的,都需要支持Crypto的私钥模式的身份验证以及基于Crypto的支付。
AI代理和链的结合
除了上面提到的两点,AI代理如何和链结合是大家正在探索的一个方向。在活动上,和Mikkke聊它正在搞的focEliza。前面提到的两种AI代理,至少第一种是需要链提供的运行或者验证环境。因为一旦一个AI代理对外提供服务,就会有信任问题,它所扮演的角色实际和智能合约一样。
关于“智能合约”这个名字当年有个争议,它只是一段代码,哪里“智能”了,AI可以让智能合约名副其实。难题是智能合约环境中如何调用AI接口。如果说让大模型运行在一个可验证的环境中这条路还比较远,用类似Oracle的方案是更切实可行的路径。
而围绕着AI代理会衍生出非常多的需求,AI代理的公共知识如何获取?AI代理如何对事实进行判定?AI代理如何识别不同平台上的同一个用户?智能合约中的“记忆”如何存储?如果我有多个设备,各装了一个AI代理,它们如何共享记忆?
你就会发现原来Web3中搞过的“数据上链”,关系上链,DID,P2P网络等等,都有新的意义和场景。
结语
复用我21年一次关于AI和区块链分享的结语,对AI更友好的互联网,也是对人类更友好的互联网。那时候还只是个脑洞,但现在未来已来。