原文标题:Deconstructing AI Frameworks: From Intelligent Agents to Decentralization Exploration   

原文作者:Zeke,YBB

原文来源:https://cointelegraph.com/news/bitcoin-92-k-correction-triggered-long-term-hodlers-etfs

编译:Tom,火星财经

引言

在此前的文章中,我们多次阐述了对 AI Memes 现状以及 AI Agent 未来发展的观点。然而,AI Agent 赛道的叙事发展与迭代速度仍然相当惊人。从“Truth Terminal”上线、迎来 Agent Summer 至今不过短短两个月时间,AI 与加密结合的叙事几乎每周都在演变。最近,市场的关注点开始转向“Framework”类项目,它们主要由技术叙事驱动。在这块相对小众的细分领域中,过去几周里已出现多家市值超过 10 亿美元的独角兽项目,还带动了一种全新的资产发行范式:项目根据其 GitHub 代码仓库来发行代币,基于这些框架构建的 Agent 同样也能发行代币。框架成为核心,Agent 则是上层应用,类似于一种资产发行平台,但本质上却是 AI 时代下涌现的全新基础设施模式。我们该如何看待这一全新趋势?本文将从框架的角度出发,结合自身思考,对 AI 框架对加密行业意味着什么进行解读。

一、什么是框架(Framework)?

从定义上看,AI 框架是一个底层开发工具或平台,集成了一系列预构建的模块、库和工具,用于简化构建复杂 AI 模型的流程。通常包含数据处理、模型训练、推理预测等功能。简单来说,可以将它视作 AI 时代的操作系统,类似于桌面端的 Windows、Linux,或移动端的 iOS、Android。每种框架都有自己的优缺点,开发者会基于需求来选择。

虽然“AI 框架”在加密圈仍是个相对新鲜的概念,但其发展在传统 AI 社区里可追溯至 2010 年的 Theano,已有近 14 年历史。谷歌的 TensorFlow、Meta 的 PyTorch、百度的 PaddlePaddle、字节跳动的 MagicAnimate 等都是当今学界和业界广泛使用的成熟框架,各自都在不同场景下有相应优势。

当前在加密领域涌现的 AI 框架项目,则基于 AI 热潮下对大量 Agent 的需求,又进一步分化到加密中的其他赛道,最终形成各自针对特定子领域的 AI 框架。我们先了解几款业内主流框架,以此更直观地说明。

1.1 Eliza

首先是由 ai16z 推出的 Eliza,一个多 Agent 仿真框架,旨在创建、部署并管理自治式 AI Agent。其主要编程语言是 TypeScript,优点在于兼容性良好,API 集成难度更低。根据官方文档,Eliza 更偏重社交媒体场景,提供对多平台的支持。它有完备的 Discord 集成功能(含语音频道),也可对接 X/Twitter 与 Telegram,能够进行直接的 API 调用。在多媒体处理层面,它能读取并分析 PDF 文档、提取与总结链接、进行音频转写、视频内容处理、图像分析与对话总结。

Eliza 目前支持四类应用场景:

  1. AI 助手类应用:客户支持 Agent、社区管理员、个人助理;

  2. 社交媒体角色:自动化内容创作者、互动机器人、品牌代言人;

  3. 知识型工种:研究助理、内容分析、文档处理;

  4. 互动角色:角色扮演、教育型导师、娱乐机器人。

当前可使用的模型包括:

  • 开源本地推理模型:如 Llama3、Qwen1.5、BERT;

  • OpenAI API 云端推理

  • 默认配置:Nous Hermes Llama 3.1B;

  • 与 Claude 集成处理复杂查询

1.2 G.A.M.E

G.A.M.E(Generative Autonomous Multimodal Entities Framework)是由 Virtual 推出的多模态 AI 框架,专注于游戏中的智能 NPC 设计。其特点在于,低代码甚至零代码的用户也可通过可视化试用界面,修改参数来设计 Agent。

在项目架构方面,G.A.M.E 采用了模块化设计,让多子系统协同工作。其详细结构如下:

  1. 代理提示词界面(Agent Prompting Interface):开发者交互界面,通过它可初始化会话并指定会话 ID、Agent ID、用户 ID 等;

  2. 感知子系统(Perception Subsystem):接收输入信息,并将其发送至策略规划引擎,同时处理对话模块的返回;

  3. 策略规划引擎(Strategic Planning Engine):框架核心,由高层规划(High-Level Planner)和低层策略(Low-Level Policy)组成。高层规划负责制定长期目标,低层策略则将规划转换为具体行动;

  4. 世界上下文(World Context):保存环境信息、世界状态及游戏状态,帮助 Agent 理解上下文;

  5. 对话处理模块(Dialogue Processing Module):负责处理消息与回复,产出对话或回应结果;

  6. 链上钱包运行者(On-Chain Wallet Operator):与区块链相关的应用,但具体功能尚不明确;

  7. 学习模块(Learning Module):根据反馈进行学习并更新 Agent 知识库;

  8. 工作记忆(Working Memory):存储近期行动、结果和当前规划等短期信息;

  9. 长时记忆处理器(Long-Term Memory Processor):根据重要度、新近度、关联度等指标提取并排序 Agent 的关键信息与工作记忆;

  10. 代理版本库(Agent Repository):保存 Agent 的目标、思考、经验和属性;

  11. 动作规划器(Action Planner):基于低层策略生成具体行动方案;

  12. 计划执行器(Plan Executor):执行由动作规划器生成的方案。

工作流程:开发者通过 Agent Prompting Interface 创建 Agent,感知子系统将输入交给策略规划引擎,后者结合记忆系统、世界上下文和 Agent 仓库进行规划并执行,学习模块对 Agent 的行为进行监控并实时调整。

应用场景:该框架主要聚焦虚拟环境中 Agent 的决策、反馈、感知以及个性等层面。除游戏外,在元宇宙领域也可应用。官方透露已有不少项目基于该框架构建。

1.3 Rig

Rig 是使用 Rust 编写的开源工具,旨在简化大语言模型(LLM)应用的开发工作,可提供统一接口让开发者方便地与多家 LLM 服务商(如 OpenAI、Anthropic)及多种向量数据库(MongoDB、Neo4j)交互。

关键特性

  1. 统一接口:无论使用哪个 LLM 提供商或向量存储,Rig 均提供一致的访问方式,极大降低集成难度;

  2. 模块化架构:包含“服务提供商抽象层”“向量存储接口”“智能 Agent 系统”等关键组件,具备灵活性与可扩展性;

  3. 类型安全:基于 Rust 特性对嵌入操作进行类型安全校验,保证代码质量与运行时安全;

  4. 高性能:框架支持异步编程,内置日志与监控,方便运维与故障排查。

工作流程:用户请求先进入“服务提供商抽象层”,将不同提供商的差异做统一封装并进行统一错误处理。核心层中,智能 Agent 可调用各类工具或向量存储查询信息,最后采用 Retrieval-Augmented Generation(RAG)等机制综合文档检索和上下文理解,生成精准的回应返回给用户。

应用场景:适合搭建快速精准的问答系统,构建高效文档搜索工具,开发具备情境感知的聊天机器人或虚拟助理,乃至基于已知数据模式自动生成文本或其它内容的场景。

1.4 ZerePy

ZerePy 基于 Python 的开源框架,旨在简化 AI Agent 在 X(原推特)平台的部署与管理。其前身是 Zerebro 项目,沿袭了核心功能,但以更模块化、更可扩展方式设计,让开发者能轻松创建个性化 AI Agent,实现自动化任务、内容创作。

ZerePy 提供命令行(CLI)界面,方便用户管理、控制所部署的 AI Agent。其核心采用模块化设计,可集成的功能模块示例:

  • LLM 集成:ZerePy 支持 OpenAI、Anthropic 等多家模型,让 Agent 能生成高质量文本;

  • X 平台集成:与 X 的 API 直接对接,支持发帖、回复、点赞、转发等操作;

  • 模块连接系统(Modular Connection System):容许开发者便捷添加对其它社交平台或服务的支持;

  • 记忆系统(未来规划):当前版本还未完全落地,但目标是让 Agent 记忆以往对话与上下文,以生成更连贯、更具个性化的内容。

整体而言,ZerePy 与 a16z 的 Eliza 都致力于搭建与管理 AI Agent,但各自侧重点不同。Eliza 更偏向多 Agent 仿真及广泛 AI 研究,ZerePy 则专注在特定社交平台(X)的应用部署,具有更强的落地导向。

二、BTC 生态的“翻版”?

如果从发展路径看,AI Agent 与 2023 年底到 2024 年初的 BTC 生态颇为相似。BTC 生态的简要脉络是:BRC20-Atomical/Rune 等多协议竞争 — BTC L2 — 围绕 Babylon 的 BTCFi。AI Agent 虽然基于传统 AI 技术栈更成熟,但整体发展轨迹也体现出某种相似:GOAT/ACT — 社交型 Agent — 分析型 AI Agent 框架竞争。从趋势来看,围绕 Agent 的去中心化与安全性等基础设施项目,可能会接力这股“框架”浪潮,成为下一阶段重点。

那么,这条赛道会不会如 BTC 生态一样,最终陷入同质化与泡沫化?我认为不太会。首先,AI Agent 的叙事并不在于重走智能合约链老路;其次,无论现有 AI 框架类项目在技术方面是真材实料,还是 PPT 阶段、或者是简单的 Ctrl+C/V,好歹都给出了新基础设施思路。很多文章将 AI 框架比作资产发行平台,而将 Agent 比作“资产”。但我个人更倾向于认为,AI 框架对应着未来的“公链”,而 Agent 则对应未来的 DApp。

在今天的加密世界里,我们有成千上万条公链、数以万计的 DApp;通用链方面有 BTC、Ethereum 和各种异构链,应用链形态更是丰富,如游戏链、存储链、Dex 链等。公链与 AI 框架本质上有相似之处,DApp 则与 Agent 的角色高度对应。

所以,在“Crypto in AI”时代,生态很可能演变成这种形态,未来争论的焦点或将从 EVM 与异构链之争转向对“Framework”路线的讨论。当前更关键的问题是去中心化或“上链化”如何进行。我相信,未来的 AI 基建项目会围绕此基础继续演进。另一个重要问题是:把这套东西搬到区块链上,究竟意义何在?

三、上链的意义何在

不管区块链与什么结合,最终都会面临“有没有实际意义?”的问题。去年我就曾在文章中批评 GameFi 在基础设施进度上“跑偏”。在此前有关 AI 的文章中,也表达了对“AI + Crypto”当下落地价值的怀疑。毕竟,传统叙事驱动力的减弱已是大势所趋,而去年价格表现尚可的项目,往往能“硬扛”或超越行情。

AI 对 Crypto 有何帮助? 此前我只想到过 AI Agent 代替用户做任务、元宇宙、让 Agent 做“员工”之类比较常规但确实有部分需求的场景。可这些需求并不一定要全部上链,而且在商业逻辑上也难形成闭环。上篇文章提到的 Agent 浏览器虽可通过意图执行产生数据标注与算力需求,但这两点与区块链的结合并不紧密,而算力依旧是中心化占优。

回顾 DeFi 的成功,它能在传统金融中占据一席之地,是因为具备更高可及性、更好效率、更低成本与去信任安全。如果套用此框架,我推测 Agent 上链化或许在以下几方面有意义:

  1. 降低成本:Agent 上链化能否降低使用成本,从而实现更高可及性与更多元的选择?这或许终将使普通人也能享受到过去只有 Web2 AI 巨头才能提供的 AI“租赁”服务。

  2. 安全:从最简单的定义看,Agent 是能与现实或虚拟世界交互的 AI。如果能操纵我的虚拟钱包,那去中心化的区块链安全方案或许不可或缺。

  3. 区块链专属金融玩法:Agent 能否在链上形成一套独特的金融机制?如 AMM 模型中,LP(流动性提供者)让普通人参与自动做市,如果 Agent 需要算力或数据标注,用户可使用 USDT 投资这些协议,并凭对系统的信任来博取收益。或许针对不同场景的 Agent 会衍生出多种金融结构。

  4. DeFi 互操作性:DeFi 互操作性尚不完善,Agent 也许能通过透明、可追溯的推理过程来打通衔接,并填补目前的空白。

四、创造力?

未来的框架类项目还会提供类似“GPT Store”那样的创业机会。对普通用户而言,当前通过框架来启动一个 Agent 仍然较为复杂。不过,若能进一步简化构建过程,并组合更多复杂功能,这类框架将有不小竞争优势,也可能促成一种更有趣的 Web3 创造者经济,大大超越 GPT Store 的体验。

目前的 GPT Store 仍更偏向传统应用,爆款应用大多由 Web2 公司制作,收益也多由创作者“独占”。根据 OpenAI 官方说明,他们只是在美国范围内给优秀开发者提供资金扶持,额度有限。

从需求层面看,Web3 仍有大量空白,且在经济体系上也能让 Web2 巨头主导的政策变得更加公平。与此同时,我们可天然引入社区经济来进一步改善 Agent。围绕 Agent 的创造者经济,将为普通人提供更多参与机会。届时 AI Meme 会远比如今的 GOAT 或 Clanker 等 Agent 要更“聪明”、更有趣。