圖源:《深潮 TechFlow》

千呼萬喚始出來,Eliza 於今日終於發布了它們的技術白皮書。

雖然我們常聽到許多 AI Agent 基於 Eliza 開源架構製作,但 Eliza 如何定義自己,在技術上一直都缺乏一個詳細且嚴肅的說明。

這份白皮書是一份很好的回答,對 Eliza 如何讓 AI 與 Web3 的深度融合、模組化的系統架構設計以及其作為開源架構的技術實現細節進行了描述。

白皮書由 Shaw 、多名 Eliza Labs 成員和其它相關組織的技術人員一同撰寫,但由於白皮書涉及大量技術細節和專業概念,對普通讀者可能不太友善。

深潮 TechFlow 對其進行了簡化和提煉,以求以通俗的語言,帶大家快速搞懂這份白皮書的內容。

圖源:《深潮 TechFlow》

為什麽要做 Eliza ?

注意,小編認為思考的前提是劃定範圍 --- 即在加密或 Web3 產業,為什麽要做 Eliza,而不是將該架構與更大範圍的類似 AI 架構做對比。

順著這個思路,在技術白皮書的簡介和背景部分,實際上對這個問題做了很好的回答:

在 AI 與 Web3 的交叉產業,一直存在著一個明顯的空白:缺乏一個能夠完美整合 Web3 應用的代理架構。

圖源:《深潮 TechFlow》

具體來說,白皮書認為 Web3 產業面臨著三個主要的挑戰:

  1. 去中心化交易的複雜性 隨著以太坊、Solana、BASE 等公鏈的蓬勃發展,在不同鏈上管理資產和執行交易變得越來越具有挑戰性。雖然市面上已有一些交易平台,但對於有客製需求的中高級使用者來說,這些平台的基礎功能往往不夠用。

  2. 鏈上數據的價值挖掘 區塊鏈上蘊含著海量的有價值資訊,從基礎的持幣地址變化、代幣價格、市值等指標,到更深層的鯨魚帳戶佔比、造市商風格等高級指標。如何有效地將這些複雜的數據轉化為有價值的洞察,是一個亟待解決的問題

  3. 社交媒體資訊的碎片化 對 Web3 產業來說,X、Discord、Farcaster 等社交平台是獲取資訊的重要渠道。但隨著意見領袖(KOL)數量的增加,資訊變得越發碎片化,如何在資訊洪流中獲取有價值的洞察,成為每個交易者的普遍挑戰。

正是基於這些現實需求,Eliza 應運而生。作為首個開源的 Web3 友善型 AI 代理作業系統,Eliza 採用模組化設計,讓開發者和使用者能夠根據自己的需求客製解決方案。

Eliza 嘗試降低普通使用者使用高級 AI 功能的門檻,無需深厚的程式撰寫經驗就能構建自己的 AI 代理。

同時,白皮書也將自己和其它的幾個常見的 AI 架構做了對比,下表可以很直觀的看出,在 Web3 支持度上,Eliza宣稱自己的是最適配的,而這也是整個白皮書所要傳達出來的關鍵點。

圖源:《深潮 TechFlow》

Eliza 的設計理念和技術創新

三大設計原則:簡單但不簡單

Eliza 的成功不是偶然的。在設計之初,團隊就確立了三個核心原則:

1. Web3 開發者優先 考慮到 Web3 主要使用 JavaScript/TypeScript 進行開發,Eliza 選擇了 TypeScript 作為開發語言。這不僅讓開發者能夠使用熟悉的工具,更讓他們能輕鬆地將區塊鏈功能整合到現有的網頁應用中。簡單來說,就是讓 Web3 開發者能夠「拿來即用」。

2. 模組化擴充應用程式設計 Eliza 將系統分解為核心運行時和四個關鍵組件:

  • Adapter(數據適配器)

  • Character(代理個性)

  • Client(消息互動)

  • Plugin(通用功能)

這種設計讓開發者可以自由添加自己的擴充應用程式、客戶端、角色和適配器,而無需關心核心運行時的細節。這也使得 Eliza 能夠支持最廣泛的模型提供商(如 OpenAI、Llama、Qwen 等)、平台整合(X、Discord、Telegram 等)和鏈兼容性(Solana、Ethereum、Ton 等。

3. 寧簡單勿複雜:

在有限的工程資源下,保持簡單的內部實現可以節省時間用於開發新功能,適應新場景,並跟上 AI 和 Web3 產業的快速發展步伐。

技術創新:內外兼修

在具體實現上,Eliza 的創新分為內部增強和外部擴充功能兩個維度

1. 內部增強 為了提升 AI 模型的思維能力,Eliza 整合了多項前沿技術:

Chain-of-Thoughts(思維鏈):

  • 技術定義:引入步驟式解釋

  • 通俗理解:就像解數學題要寫過程一樣,AI 也會把思考過程一步步寫出來,而不是直接給出答案。這樣不僅結果更準確,人類也能理解 AI 是如何得出結論的

Tree-of-Thoughts(思維樹):

  • 技術定義:允許分支探索多個解決方案

  • 通俗理解:像下棋時要考慮多種可能的走法一樣,AI 會同時探索多個解決方案,然後選擇最優的那個。這就像在思維的樹上,選擇最好的那條分支

Graph-of-Thoughts(思維圖):

  • 技術定義:連接推理路徑

  • 通俗理解:把問題看作一張網,各個想法之間互相連接。就像我們解決複雜問題時,會把各種相關的想法聯系起來,形成思維導圖

Layer-of-Thoughts(思維層):

  • 技術定義:分層推理 AI

  • 通俗理解:像過濾器一樣,把思考過程分成不同的層次。就像我們解決問題時,先考慮大方向,再細化到具體細節,層層遞進

2. 外部擴充功能 為了增強實際問題解決能力,Eliza 整合了多種外部能力:

RAG(檢索增強生成):

  • 技術定義:通過檢索來增強生成能力

  • 通俗理解:就像學生做作業時可以查閱教科書一樣,AI 在回答問題時也可以查閱它的「資料庫」,確保答案更準確

向量數據庫:

  • 技術定義:儲存和檢索結構化數據

  • 通俗理解:相當於 AI 的「圖書館」,可以快速找到相似的內容。比如你說「我想找一首關於月亮的詩」,它能快速找到所有相關的詩歌

網路搜尋:

  • 技術定義:即時獲取網路資訊

  • 通俗理解:讓 AI 像人類一樣能夠上網搜尋最新資訊,不被限制在固定的知識範圍內

文本轉圖像、影片、3D 模型:

  • 技術定義:將文字描述轉換為多媒體內容

  • 通俗理解:就像畫家能根據文字描述畫出畫作一樣,AI 可以根據你的描述生成圖片、影片,甚至 3D 模型

與其它 Web3 產業的架構的對比

在目前的 Web3 AI 代理架構中,Eliza 展現出明顯的優勢。根據來自 50 多位 AI 研究人員和高級區塊鏈開發者的回饋,Eliza 在以下關鍵指標上都優於其它架構

  • 模型提供者的支持度

  • 鏈兼容性情況

  • 功能完整性情況

  • 社交媒體整合情況

圖源:《深潮 TechFlow》

Eliza OS:一個精心打造的 Web3 AI 生態系

在瞭解了 Eliza 的設計理念後,讓我們來看看這個架構究竟是如何運作的。可以把 Eliza 想象成一個精心設計的樂高積木系統,每個部分都能完美配合,又保持著極強的靈活性。

核心組件:五個關鍵角色

在 Eliza 的世界裏,五個核心組件相互配合,構成了一個完整的智慧系統。

1. Agents(代理):系統的主角

它們就像一個個獨立的「數位助手」,負責處理各種自主互動。每個代理都擁有自己的「記憶」和「性格」,能通過 Discord、X 等不同渠道與使用者進行連貫的對話和互動。

2. Character Files(角色配置):代理的「人設」

要讓這些代理富有個性,就需要 Character Files(角色配置)的支持。這相當於代理的「個人簡歷」,不僅定義了其身份和個性特徵,還規定了它能使用哪些模型(如 OpenAI、Anthropic),以及可以執行哪些操作(如區塊鏈交易、NFT 鑄造)。通過精心設計的角色配置,每個代理都能展現出獨特的專業特長和行為方式。

3. Providers(提供者):代理的「感知系統」

在與外界互動時,代理需要 Providers(提供者)作為其「感知系統」。就像人類需要感官來感知世界一樣,提供者為代理提供市場數據、錢包詳情、情緒分析等即時資訊,幫助它們更好地理解目前環境和上下文。

4. Actions(行動):代理的「技能庫」

當需要採取具體行動時,Actions(行動)就成為代理的「技能庫」。從簡單的買賣訂單到複雜的 NFT 生成,每個操作都經過嚴格的安全驗證,確保在處理金融相關任務時萬無一失。這些技能讓代理能夠真正地在 Web3 世界中發揮作用。

5. Evaluators(評估器):代理的「決策系統」

最後,Evaluators(評估器)則擔任代理的「決策系統」,負責評估對話內容,提取重要資訊,並幫助代理建立長期記憶。它不僅追蹤目標完成進度,還確保整個對話過程的連貫性。

智慧互動:不只是簡單的對話

在互動方面,Eliza 採用了多層次的理解系統,就像一個經驗豐富的翻譯官,不僅要理解字面意思,還要理解說話的背景和意圖。這個系統能夠準確理解使用者的真實需求,在不同的通訊平台保持一緻的體驗,並根據上下文靈活調整回應方式。

圖源:《深潮 TechFlow》

擴充應用程式系統:無限擴充功能的可能

Eliza 的擴充應用程式系統本質上是個工具箱,為整個架構帶來了強大的擴充功能性,這種擴充功能體現在多媒體生成、Web3 整合和基礎設施三個方向上:

  • 在多媒體生成方面,它能夠生成圖片、影片、3D 模型,支持 NFT 系列的自動生成,還提供圖片描述和分析能力。

  • 在 Web3 整合方面,它支持以太坊、Solana 等多鏈操作,提供完整的交易功能套件,並整合各類 DeFi 操作。

  • 在基礎設施方面,它提供了瀏覽器服務、文檔處理、語音轉文字等基礎能力。

通過這種模組化的設計,Eliza 不僅保持了系統的穩定性,還為開發者提供了近乎無限的擴充功能可能。這也使得 Eliza 能夠適應 Web3 世界中不斷湧現的新需求和新場景。

Eliza 的實力幾何?從數據看真相

當一個新技術架構出現時,大家最關心的往往是它的實際表現。Eliza 在這方面給出了一個坦誠的答案。

在 GAIA 基準測試(這是一個專門評估 AI 代理解決現實問題能力的測試平台)中,Eliza 展現出了不俗的實力。這個測試不是在考察簡單的問答能力,而是要求 AI 代理具備邏輯推理、多模態處理、網頁瀏覽和工具使用等多項技能。

雖然在測試中,Eliza 的得分(19.42%)與目前最頂尖的方案還有一定差距,但考慮到它是一個專注於 Web3 產業的架構,這個成績已經相當亮眼。特別是在基礎任務的處理上(Level 1),Eliza 達到了 32.21% 的完成率,顯示出其紮實的基礎能力。

圖源:《深潮 TechFlow》

Web3 產業:開創性的標準制定者

更值得關注的是,Eliza 在 Web3 產業實際上扮演著「標準制定者」的角色。由於 Web3 導向的 AI 系統仍處於早期階段,Eliza 率先提出了一個完整的評估標準體系,為整個產業指明瞭發展方向。

這個評估體系分為三個層次,白皮書把它叫做 Web3 AI 版本的 「圖靈測試」:

  • 基礎能力:包括錢包創建、代幣交易、智能合約互動等基本操作

  • 進階功能:整合最新的 AI 技術,如文本轉影片/3D、RAG 支持等

  • 高級特性:能夠基於使用者指令自主規劃和推理,實現真正的智慧決策

目前,Eliza 已經成功實現了基礎層次的全部功能,並正在向進階層次邁進。團隊表示,他們堅信在未來幾年內,將能夠實現完全自主的 AI 代理系統。

圖源:《深潮 TechFlow》

實際應用:市場用真金白銀投票

原白皮書還有一節是關於程式碼展示,用來說明目前能用該架構做出來的實際應用;考慮到理解難度以及技術細節,在此略過,僅展現更加總體經濟的實際應用情況。

根據白皮書描述,截至 2025 年 1 月,已經有多個重要的 Web3 項目基於 Eliza 構建了他們的 AI 代理系統,這些合作夥伴的總市值超過 200 億美元。

圖源:《深潮 TechFlow》

這個數位或許本身就是市場對 Eliza 技術實力的最好背書。

更重要的是,Eliza 團隊對未來充滿信心。他們認為,隨著這些「智慧代理」的不斷進化,我們將看到一個由多個 AI 單元協同工作的新時代。正如 Anthropic 的執行長 Dario Amodei 所說的「天才數據中心」願景,Eliza 正在為這個未來鋪平道路。

現存限制與未來展望:誠懇的自我剖析

任何技術架構都不可能十全十美,Eliza 團隊在白皮書中也坦誠地指出了目前架構存在的局限性。

待解決的三大挑戰

  1. 工作流程系統的缺失:就像一個熟練的助手需要一套標準化的工作流程一樣,當開發者想要實現一些常規性的任務時(比如定期從多個源頭彙總數據),現有的 Eliza 架構還無法提供現成的解決方案。對於這類需求,可能還是需要借助 Dify 或 Coze 這樣帶有圖形界面的工作流系統。

  2. 多代理系統的性能問題。隨著代理數量的增加,系統需要處理的上下文和記憶內容呈指數級成長。特別是在處理大量輸入輸出任務時,如何平衡計算開銷和運行效率,仍然是一個待解決的技術難題。

  3. 多語言支持的拓展需求。目前 Eliza 主要基於 TypeScript,但要吸引更多產業的開發者加入,還需要擴充功能對 Python、Rust 等其它程式語言的支持。

展望:開創去中心化 AI 新紀元

儘管存在這些限制,但 Eliza 的意義已經遠遠超出了一個技術架構本身。它代表了 AI 技術和 Web3 應用深度融合的一次開創性嘗試。

通過將每個功能模塊都設計成標準的 TypeScript 程式,Eliza 確保了使用者對系統的完全控制權。同時,它還提供了與區塊鏈數據、智能合約的無縫整合能力。這種設計既保證了安全性,又維持了極強的擴充功能性。

正如白皮書結尾所說,Eliza 的可能性僅受限於使用者的想象力。隨著 AI 和 Web3 技術的持續演進,Eliza 也將不斷發展,繼續引領去中心化 AI 的發展方向。

  • 本文經授權轉載自:《深潮 TechFlow》

  • 原文作者:《深潮 TechFlow》

『多個AI Agent採用!Eliza白皮書公佈:詳解3大原理、5大核心組件』這篇文章最早發佈於『加密城市』