作者:jolestar

上週倒騰了一下 AI Agent,前天參加了 ai16z 在北京的活動,想看看 AI Agent 現在實際上能幹啥,思考一下它未來能幹啥。

AI Agent 的現狀讓我想起那個梗圖,自動售貨機裏面藏了個人。大家已經想象中的 AI Agent 已經開始擁有自主意識了,但實際上的 AI Agent 裏面其實藏了個開發者。(這裏大家腦補畫面,我嘗試讓 AI 生成這個圖片,發現 AI 不能理解“藏”)

AI Agent 框架的基本工作方式

AI Agent 框架當前扮演一個粘合劑的作用,把 client(Twitter,Discord,Telegram 等) 和各種插件(各鏈等)粘合起來,然後框架提供一個基礎庫(記憶存儲,會話隔離,上下文生成)等,後面對接各種 AI 平臺接口。

AI Agent 框架如何和應用以及業務場景結合

從去年 AI 火爆以來,各種平臺和工具涌現,最關鍵就是要解決一個問題,AI 如何和應用結合。有 AI 平臺嘗試提供插件的方式,有的打造工作流模型,也有傳統應用在應用內嵌入 AI 的方式。但這裏面的關鍵是: 1. 應用的交互入口在哪裏?2. AI 如何和現有業務邏輯結合。

各 AI 平臺給用戶提供的應用的交互入口都是一個類似聊天窗口的對話框,顯然大家都認爲和 AI 應用的交互方式應該是一種“擬人”的方式。而這點上 AI Agent 聰明之處在於它直接接入了所有的開放 IM 以及社交系統,顯然比新搞一個更容易接受。

AI 如何和現有業務邏輯結合。AI Agent 提供的方案是讓開發者把 AI 的決策融入到業務場景中。編程語言需要確定性,if 的條件只能是 true 或者 false,無法處理模糊的業務邏輯。而通過 AI 可以將複雜的邏輯轉換成精確的條件,然後就可以無縫融入到業務場景中去了。

比如羣內回覆消息這個功能,傳統的 IM Bot 需要通過一些明確的消息指令才能觸發,而通過 AI 可以實現一個方法 shouldReplyMessage,給他上下文,它返回 true or false。

AI 在業務邏輯場景中的作用主要是:

1. “意圖”發現:通過提示詞中的說明,讓 AI 根據上下文發現用戶文本消息中的“意圖”,把意圖映射到具體的代碼。

2. 協助決策:通過 AI 將模糊的複雜條件轉換成確定的 true/false 或者枚舉類型,然後結合到業務邏輯中去。

看到這裏,很多人可能對 AI Agent 要失望了,很多人以爲的 AI Agent 就是教一下 AI 它就啥都會了。實際上因爲大模型的上下文限制的難題,沒辦法(至少當前)打造一個萬能的 AI,讓它可以幹任何事情。但好消息是程序員不用擔心失業了,AI 後面還是需要藏着大量的程序員,還需要有人來堆 if else,但關鍵的區別是程序可以處理的業務邊界在擴展。

兩種 AI Agent

在活動上,問了 shaw 一個問題,市場對 AI Agent 有兩種期望,1. AI Agent 自己扮演一個角色,有自己的 ID,品牌,給用戶提供服務。2. 用戶有個人 AI Agent,相當於個人助手,可以協助用戶處理一些業務。這兩種 AI Agent 哪種會更受歡迎?他覺得兩個方向都會不錯,也有可能結合起來。

現在市面上大家主要探索的還是第一個方向。這個方向類似於服務 AI Agent 化,未來可能沒有 App 界面了,App 都 AI Agent 化了,擬人化了。而第二個方向則是應用客戶端的 Agent 化,未來的應用客戶端會是助手 Agent 的一個插件,應用本地數據變成了 Agent 記憶庫的一部分,同時這個插件也負責和雲端的服務 Agent 溝通。而這是一種新的應用架構模式,會改變整個基礎設施。

AI Agent 對基礎設施的要求

1. 基礎設施要實現無准入門檻(Permissionless),不然 AI Agent 會被各種防攻擊策略限制,服務應該用經濟成本的方式(Gas)防攻擊。這點上開放程度比較差的平臺會面臨比較大的衝擊,當年 Web2 初期的開放平臺熱會重新被點燃。

2. AI Agent 需要能操作資金來付費,用以解決上面的問題。

也就是說,未來的服務,無論是否是基於區塊鏈的,都需要支持 Crypto 的私鑰模式的身份驗證以及基於 Crypto 的支付。

AI Agent 和鏈的結合

除了上面提到的兩點,AI Agent 如何和鏈結合是大家正在探索的一個方向。在活動上,和 Mikkke聊它正在搞的 focEliza。前面提到的兩種 AI Agent,至少第一種是需要鏈提供的運行或者驗證環境。因爲一旦一個 AI Agent 對外提供服務,就會有信任問題,它所扮演的角色實際和智能合約一樣。

關於“智能合約”這個名字當年有個爭議,它只是一段代碼,哪裏“智能”了,AI 可以讓智能合約名副其實。難題是智能合約環境中如何調用 AI 接口。如果說讓大模型運行在一個可驗證的環境中這條路還比較遠,用類似 Oracle 的方案是更切實可行的路徑。

而圍繞着 AI Agent 會衍生出非常多的需求,AI Agent 的公共知識如何獲取?AI Agent 如何對事實進行判定?AI Agent 如何識別不同平臺上的同一個用戶?智能合約中的“記憶”如何存儲?如果我有多個設備,各裝了一個 AI Agent,它們如何共享記憶?

你就會發現原來 Web3 中搞過的“數據上鍊”,關係上鍊,DID,P2P 網絡等等,都有新的意義和場景。

結語

複用我 21 年一次關於 AI 和區塊鏈分享的結語,對 AI 更友好的互聯網,也是對人類更友好的互聯網。那時候還只是個腦洞,但現在未來已來。