作者:accelxr,1KX;翻譯:0xjs@金色財經

當前生成式模型的主要目的是內容創建和信息過濾。然而,最近關於AI智能體(使用外部工具完成用戶定義目標的自主參與者)的研究和討論表明,如果爲AI提供類似於1990年代互聯網的經濟通道,AI可能會獲得實質性的解鎖。

爲此,智能體需要對他們可以控制的資產進行代理,因爲傳統金融系統不是爲他們設置的。

這是加密發揮作用的地方:加密提供了一種具有快速結算的、數字化的支付和所有權層,特別適合構建 AI 智能體。

本文我將向你介紹智能體和智能體架構的概念,研究中的示例如何證明智能體具有超越傳統LLM的新興屬性,以及圍繞基於加密的智能體構建解決方案或產品的項目。

什麼是智能體

AI 智能體是 LLM 驅動的實體,能夠規劃並採取行動,在多次迭代中實現目標。

智能體架構由單個只能或多個智能體組成,共同解決問題。

通常,每個智能體都被賦予個性並可以使用各種工具,這些工具將幫助他們獨立或作爲團隊的一部分完成工作。

智能體架構與我們今天通常與 LLM 交互的方式不同:

零次提示是大多數人與這些模型交互的方式:你輸入提示,LLM 根據其預先存在的知識生成響應。

在智能體架構中,你初始化目標,LLM 將其分解爲子任務,然後它遞歸地提示自己(或其他模型)自主完成每個子任務,直到達到目標。

單智能體架構與多智能體架構

單智能體架構:一種語言模型自行執行所有推理、規劃和工具執行。沒有來自其他智能體的反饋機制,但人類可以選擇向智能體提供反饋。

多智能體架構:這些架構涉及兩個或多個智能體,其中每個智能體可以使用相同的語言模型或一組不同的語言模型。智能體可以使用相同的工具或不同的工具。每個智能體通常都有自己的角色。

  • 垂直結構:一個智能體充當領導者,其他智能體向其彙報。這有助於組織小組的輸出。

  • 水平結構:一個關於任務的大型小組討論,每個智能體都可以看到其他消息並自願完成任務或調用工具。

智能體架構:配置文件

智能體具有配置文件或個性,它們將角色定義爲提示,以影響 LLM 的行爲和技能。這在很大程度上取決於特定的應用程序。

可能許多人今天已經將其用作提示技術:“你是營養專家。爲我提供一份膳食計劃......”。有趣的是,爲 LLM 提供角色可以提高其輸出與基線相比。

配置文件可以通過以下方法制作: 

  • 手工製作:由人類創建者手動指定的配置文件;最靈活,但也耗時。 

  • LLM 生成:使用 LLM 生成的配置文件,該配置文件包含圍繞組成和屬性的規則集 +(可選)少量樣本示例。

  • 數據集對齊:配置文件是根據現實世界的人員數據集生成的。

智能體架構:內存

智能體的記憶存儲從環境中感知到的信息,並利用這些信息制定新的計劃或行動。記憶使智能體能夠根據其經驗自我進化和行事。 

  • 統一記憶:類似於通過情境學習/通過持續提示實現的短期記憶。所有相關記憶都會在每次提示中傳遞給智能體。主要受上下文窗口大小的限制。 

  • 混合:短期+長期記憶。短期記憶是當前狀態的臨時緩衝區。反射或有用的長期信息永久存儲在數據庫中。有幾種方法可以做到這一點,但常見的方法是使用矢量數據庫(將記憶編碼爲嵌入並存儲;回憶來自相似性搜索) 

  • 格式:自然語言、數據庫(例如,經過微調以理解 SQL 查詢的 SQL)、結構化列表、嵌入

智能體架構:規劃

複雜任務解構爲更簡單的子任務以單獨解決。

無反饋規劃:

在這種方法中,智能體在採取行動後不會收到影響未來行爲的反饋。一個例子是思路鏈 (Chain of Thought,CoT),其中鼓勵 LLM 在提供答案時表達其思維過程。

  • 單路徑推理(例如零次CoT)

  • 多路徑推理(例如自洽 CoT,其中生成多個 CoT 線程並使用最高頻率的答案)

  • 外部規劃器(例如規劃域定義語言)

帶反饋的規劃:

根據外部反饋迭代細化子任務

  • 環境反饋(例如遊戲任務完成信號)

  • 人爲反饋(例如徵求用戶的反饋)

  • 模型反饋(例如徵求另一個 LLM 的反饋 - 衆包)

智能體架構:行爲(Action)

Action負責將智能體的決策轉化爲具體結果。

行爲目標有多種可能的形式,例如: 

  • 任務完成(例如在 Minecraft 中製作鐵鎬) 

  • 通信(例如與另一個智能體或人類分享信息) 

  • 環境探索(例如搜索自己的行爲空間並學習自己的能力)。

行爲的產生通常來自記憶回憶或計劃遵循,行爲空間由內部知識、API、數據庫/知識庫以及對自身的使用外部模型組成。

智能體架構:能力獲取

智能體要想在動作空間內正確執行動作,就必須具備特定於任務的能力。主要有兩種方法可以實現這一點:

  • 通過微調:在人工註釋、LLM 生成或真實世界示例行爲數據集上訓練智能體。

  • 無需微調:可以通過更復雜的提示工程和/或機制工程(即在進行反覆試驗時結合外部反饋或經驗積累)使用 LLM 的先天能力。

文獻中的智能體例子

生成式智能體:人類行爲的交互式模擬:在虛擬沙箱環境中實例化生成式智能體,顯示多智能體系統具有突發社交行爲。從即將到來的情人節派對的單個用戶指定提示開始,智能體會在接下來的兩天內自動發送邀請、結識新朋友、相互約會,並協調在合適的時間一起參加派對。你可以使用a16z AI Town的實現親自嘗試。

描述解釋計劃選擇 (DEPS) :第一個可以完成 70 多項 Minecraft 任務的零樣本多任務智能體。

Voyager:Minecraft 中第一個由 LLM 驅動的體現終身學習的智能體,它可以不斷探索世界,獲得各種技能,並在無需人工干預的情況下做出新發現。根據反覆試驗的反饋不斷改進其技能執行代碼。

CALYPSO:爲遊戲“龍與地下城”設計的智能體,可以協助地下城主創作和講述故事。它的短期記憶建立在場景描述、怪物信息和之前的總結之上。

Minecraft中的幽靈 (GITM) :Minecraft 中能力一般的智能體,獲取鑽石的成功率爲 67.5%,遊戲中所有物品的完成率爲 100%。

SayPlan :基於 LLM 的機器人大規模任務規劃,使用 3d 場景圖形表示,展示了從抽象和自然語言指令爲機器人執行長期任務規劃的能力。

HuggingGPT:根據用戶提示使用 ChatGPT 進行任務規劃,根據 Hugging Face 上的描述選擇模型,並執行所有子任務,在語言、視覺、語音和其他具有挑戰性的任務中取得了令人印象深刻的成果。

MetaGPT:接受輸入並輸出用戶故事 / 競爭分析 / 需求 / 數據結構 / API / 文檔等。在內部,有多個智能體構成軟件公司的各種功能。

ChemCrow:一種 LLM 化學智能體,旨在使用 18 種專家設計的工具完成有機合成、藥物發現和材料設計等任務。自主規劃和執行驅蟲劑、三種有機催化劑的合成,並指導發現一種新型髮色團。

BabyAGI :使用 OpenAI 和向量數據庫(例如 Chroma 或 Weaviate)來創建、確定優先級和執行任務的通用基礎設施。

AutoGPT:用於啓動 LLM 智能體的通用基礎設施的另一個示例。

 Crypto中的智能體示例

(注意:並非所有示例都是基於 LLM 的 + 有些可能更鬆散地基於智能體概念)

來自Ritualnet的FrenRug:基於 GPT-4 土耳其地毯推銷員遊戲 { https:// aiadventure.spiel.com/carpet }。Frenrug 是一位經紀人,任何人都可以嘗試說服他購買他們的Friend.tech Key。每條用戶消息都會被傳遞給由不同 Infernet 節點運行的多個 LLM。這些節點在鏈上響應,並由 LLM 投票決定智能體是否應該購買提議的Key。當有足夠多的節點響應時,投票就會聚合,監督分類器模型會確定操作並在鏈上傳遞有效性證明,從而可以驗證多項分類器的鏈下執行情況。

Gnosis上使用autonolas的預測市場智能體:AI 機器人本質上是 AI 服務的智能合約包裝器,任何人都可以通過付款和提問來調用它。服務會監控請求、執行任務並在鏈上返回答案。這種 AI 機器人基礎設施已通過 Omen 擴展到預測市場,其基本理念是智能體將積極監控和押注新聞分析的預測,最終得出更接近真實賠率的彙總預測。智能體在 Omen 上搜索市場,自主向“機器人”支付有關該主題的預測,並利用市場進行交易。

ianDAOs GPT<>Safe演示:GPT 使用syndicateio交易雲 API在自己Base鏈上的Safe 多重簽名錢包中自主管理 USDC。你可以與它交談,並就如何最好地利用其資本提出建議,它可能會根據你的建議進行分配。

遊戲智能體:這裏有多個想法,但簡而言之,虛擬環境中的 AI 智能體既是同伴(比如《Skyrim》中的 AI NPC),又是競爭對手(比如一羣胖乎乎的企鵝)。智能體可以自動執行收益策略,提供商品和服務(比如:店主、旅行商人、老練的生成式任務提供者),或者像在Parallel Colony和Ai Arena中的半可玩角色。

Safe守護天使(Guardian Angels):使用一組 AI 智能體來監控錢包並防禦潛在威脅,以保護用戶資金並提高錢包安全性。特性包括在發生異常或黑客攻擊時自動撤銷合約權限和提取資金。

Botto:雖然 Botto 是一個定義較爲寬泛的鏈上智能體示例,但它展示了自主鏈上藝術家的概念,創作的作品由代幣持有者投票並在 SuperRare 上拍賣。人們可以想象採用多模態智能體架構的各種擴展。 ---

一些值得關注的智能體項目

(注意:並非所有項目都是基於 LLM 的 + 有些可能更鬆散地基於智能體概念)

AIWay Finder——協議、合約、合約標準、資產、功能、API 功能、例程 + 路徑的去中心化知識圖譜(即尋路者智能體可以導航的區塊鏈生態系統虛擬路線圖)。用戶將因識別智能體使用的可行路徑而獲得獎勵。此外,你可以鑄造包含角色設置和技能激活的外殼(即智能體),隨後可以將其插入尋路者知識圖譜。

Ritualnet——如上文 frenrug 示例所示,Ritual infernet 節點可用於設置多智能體架構。節點監聽鏈上或鏈下請求,並提供帶有可選證明的輸出。

Morpheus——個人通用 AI 的點對點網絡,可以代表用戶執行智能合約。這可用於 web3 錢包和 tx 意圖管理、通過聊天機器人界面進行數據解析、dapps 和合約的推薦模型,以及通過連接應用程序和用戶數據的長期記憶擴展智能體操作。

Dain Protocol——探索在 Solana 上部署智能體的多種用例。最近演示了一個加密交易機器人的部署,該機器人可以提取鏈上和鏈下信息以代表用戶執行(例如,如果拜登輸了,就出售 BODEN)

Naptha——智能體編排協議,具有用於簽約智能體的鏈上任務市場、編排任務的操作員節點、支持跨不同節點異步消息傳遞的 LLM 工作流編排引擎以及用於驗證執行的工作流證明系統。

Myshell——類似於http:// character.ai的 AI 角色平臺,創作者可以在其中將智能體配置文件和工具貨幣化。多模態基礎設施,包含一些有趣的示例智能體,包括翻譯、教育、陪伴、編碼等。包含簡單的無代碼智能體創建和用於組裝 AI 小部件的更高級的開發人員模式。

AI Arena——一款具有競爭力的 PvP 格鬥遊戲,玩家可以購買、訓練和對抗支持 AI 的 NFT。玩家通過模仿學習訓練他們的智能體 NFT,其中 AI 通過學習玩家行爲的相關概率來學習如何在不同的地圖和場景中玩遊戲。經過訓練後,玩家可以派出他們的智能體參加排名戰以獲得代幣獎勵。不是基於 LLM,但仍然是智能體遊戲可能性的一個有趣例子。

Virtuals Protocol——一種用於構建和部署多模態智能體到遊戲和其他在線空間的協議。當今虛擬的三個主要原型包括 IP 角色鏡像、特定功能智能體和個人替身。貢獻者向虛擬貢獻數據和模型,驗證者充當守門人。存在一個經濟層面的激勵機制來促進開發和貨幣化。

Brianknows——爲用戶提供用戶界面,以便與智能體進行交互,智能體可以執行交易、研究特定於加密貨幣的信息並及時部署智能合約。目前支持 100 多個集成中的 10 多個操作。最近的一個例子是讓智能體使用自然語言代表用戶在 Lido 中質押 ETH。

Autonolas——提供輕量級本地和基於雲的智能體、共識運營的去中心化智能體和專業智能體經濟。突出的例子包括 DeFi 和基於預測的智能體、由 AI 驅動的治理代表和智能體對智能體(agent-to-agent)工具市場。提供用於協調和激勵智能體操作的協議 + OLAS 堆棧,這是一個供開發人員構建可共同擁有的智能體的開源框架。

Creator.Bid——爲用戶提供與 X 和 Farcaster 實時 API 相連的社交媒體角色智能體。品牌可以啓動基於知識的智能體,在社交平臺上執行與品牌一致的內容。

Polywrap——提供各種基於智能體的產品,例如 Indexer(Farcaster 的社交媒體智能體)、AutoTx(使用 Morpheus 和flock.io構建的規劃和交易執行智能體)、predictionprophet.ai (有 Gnosis 和 Autonolas 的預測智能體)和fundpublicgoods.ai (用於撥款資源分配的智能體)。

驗證——由於經濟流動將由智能體指導,因此輸出驗證將非常重要(以後的文章中將對此進行詳細介紹)。驗證方法包括來自Ora Protocol,來自如Modulus Labs+Giza+ EZKL團隊的zkML、博弈論解決方案以及像 TEE 這樣的基於硬件的解決方案。 

對於鏈上智能體的一些想法

  • 可擁有、可交易、代幣門控的智能體,可執行各種類型的功能,從陪伴到金融應用,

  • 可以代表你識別、學習並參與遊戲經濟的智能體;也可以作爲協作、競爭或完全模擬環境中的玩家的自主智能體。

  • 可以模擬真實人類行爲的智能體,用於收益機會

  • 多智能體管理的智能錢包,可以充當自主資產管理者

  • AI 管理的 DAO 治理(例如代幣委託、提案創建或管理、流程改進等)

  • 使用 web3 存儲或數據庫作爲可組合的向量嵌入系統,用於共享和永久內存狀態

  • 本地運行的智能體,參與全局共識網絡,執行用戶定義任務

  • 現有和新協議交互和 API 的知識圖譜

  • 自主守護者網絡、多重簽名安全、智能合約安全和功能增強

  • 真正自主的投資 DAO(例如,使用藝術史學家、投資分析師、數據分析師和degen智能體角色的收藏家 DAO)

  • 代幣經濟學和合約安全模擬與測試

  • 通用意圖管理,特別是在加密用戶體驗(如橋接或 DeFi)的情況下

  • 藝術或實驗項目

吸引下一個十億用戶

正如Varaint Fund聯合創始人Jesse Walden最近所言,自主智能體是區塊鏈使用方式的一次進化,而不是革命:我們已經有了協議任務機器人、狙擊機器人、MEV 搜索器、機器人工具包等。智能體只是這一切的延伸。

加密的許多領域都是以有利於智能體執行的方式構建的,例如完全鏈上游戲和 DeFi。假設 LLM 的成本相對於任務性能呈下降趨勢 + 創建和部署智能體的可訪問性增加,很難想象一個AI智能體不會主宰鏈上交互併成爲加密的下一個十億用戶的世界。

閱讀材料:

AI Agents That Can Bank Themselves Using Blockchains

The new AI agent economy will run on Smart Accounts

A Survey on Large Language Model based Autonomous Agents (I used this for identifying the taxonomy of agentic architectures above, highly recommend) 

ReAct: Synergizing Reasoning and Acting in Language Models

Generative agents: Interactive simulacra of human behavior

Reflexion: Language Agents with Verbal Reinforcement Learning

Toolformer: Language Models Can Teach Themselves to Use Tools

Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents 

Voyager: An Open-Ended Embodied Agent with Large Language Models

LLM Agents Papers GitHub Repo

原文鏈接