撰文:司马聪
Crypto × AI,加密世界的人工智能叙事,是会迭代的,与任何行业的叙事本质一致,更类似于中本聪的比特币白皮书所言,比特币只是一种点对点支付系统的奖励,而这个支付系统网络本身才是核心。代币只是表象,解决痛点才是核心逻辑,如果说以 Depin 中的算力租用等作为标志,如 AO、Aethir,并与之类似的加密商业模型看成加密人工智能的 1.0 叙事,随着人工智能发展的脚步,AI Agent 是加密人工智能的 2.0 叙事吗?
在应用层,是否有开创性的,具备盈利模式落地的革命性产品已成为判断人工智能是否存在泡沫的基础逻辑之一;
算力塑造了人工智能行业的底层逻辑之一,也是作为基础设施最重要的存在之一;
用户规模和用户活跃度,收入规模是衡量人工智能泡沫的核心指标;
AI Agent 的应用场景是底层核心逻辑之一,也是叙事的核心支撑,解决痛点是叙事的本质内涵;
构建基础设施的算力需求构成了人工智能底层逻辑的核心之一,塑造了 Depin 中的算力租用等商业模型的核心叙事;
用 AI Agent 推广 Meme coin 是强行蹭 AI 中的 AI Agent 流量,可以直接对标铭文;
截止 2024 年 11 月 26 日,短短两周时间里,clanker 共发行了 3500 个代币,2023 年 3 月 9 日一天有超过 30000 个「铭文」被铸造,其中文本类型「铭文」数量接近 27000 个;
目前来看,Crypto × AI 的 AI Agent 叙事 2.0 不是智能体部署 Meme coin,也不该成为这个赛道的叙事 2.0;
一半海水一半火焰
首先是 AI 行业的无限想象空间。
2024 年初,OpenAI 的视频生成模型 Sora 横空出世,首次具备强大的视频生成能力,引发业界的轰动。5 月份,OpenAI 发布 GPT-4o,其中「o」是「omni(全能)」的缩写,这个模型能够处理或生成文本、图像和音频等多种形式的数据,甚至还拥有逼真的实时语音对话能力。
Meta 在 7 月推出 Llama 3.1 405B 版本,在推理、数学、多语言处理和长上下文任务上能够与 GPT-4o 和 Claude 3.5 Sonnet 等头部基座模型不相上下。
Llama 3.1 缩小了开放模型与封闭模型之间的差距 ,进一步挤压了全球非头部基座大模型的生存空间。
在算力的焦虑和超高投资门槛下,模型的小型化和端侧化也逐渐形成一种趋势。多家公司推出 4B(40 亿)参数以下的专业或端侧小模型,在尽量保持性能的前提下,大幅降低对算力的需求。
苹果公司在 6 月份发布面向 iPhone、iPad 和 Mac 的个人智能化系统 Apple Intelligence,在上述设备中嵌入一个大约 3B(30 亿参数)的本地模型,提供强大的生成式 AI 功能。
被誉为「AlphaFold 之父」的谷歌 DeepMind 公司 Demis Hassabis 博士和 John Jumper 博士因为蛋白质结构预测获诺贝尔化学奖,Geoffrey Hinton 和 John Hopfield 因神经网络研究荣获诺贝尔物理学奖,彰显了 AI 对于生物和物理学的深远影响。同样值得一提的是,得益于多模态大模型的发展,自动驾驶的安全性和可靠性得到了显著提升,具身智能机器人的感知、决策与交互能力也得到增强。
在 AI 基础设施领域,英伟达凭借强大的赚钱能力(Q2 收入约 300 亿美金,净利润约 166 亿美金)和算力芯片的垄断地位,成为当前仅次于苹果,全球市值第二的公司(截止 2024 年 11 月 26 日,市值超过 3.3 万亿美金)。传统竞争对手如 AMD 和英特尔无法缩小与其的差距,而 Cerebras、Groq 及其他 AI 芯片初创公司则希望在推理芯片方面打开缺口。
但在应用层,是否有开创性的,具备盈利模式落地的革命性产品已成为判断人工智能是否存在泡沫的基础逻辑之一。
AI 的应用落地还不及预期。这体现在头部产品在用户增长、留存和活跃度方面还有待提升。并且,这些应用主要集中在大语言模型助手、AI 陪伴、多模态创意工具、编程辅助、销售营销等若干领域,它们收获了一些用户或商业成果,但覆盖范围还不够广。此外,目前 AI 行业在自身造血能力方面还有所欠缺,投入与产出严重不对等。
算力塑造了人工智能行业的底层逻辑之一,也是作为基础设施最重要的存在之一。
据腾讯科技的梳理,仅 Google、Meta、微软和亚马逊四巨头在 2024 年 Q2 就投入 529 亿美金。截至 8 月底,AI 创业公司已斩获高达 641 亿美元的风险投资。
四巨头建设的数据中心达到 1000 个。除了能源,GPU 几乎占据了数据中心一半的成本,英伟达在 2024 年第二季度卖 GPU 算力的收入达到 300 亿美金。
Elon Musk 的 xAI 公司已建成名为 Colossus 的超级计算机,配备 10 万块 Nvidia H100 GPU,并计划将 GPU 容量翻倍。Meta 也在训练新一代 Llama 4 AI 模型,预计 2025 年发布,这个模型使用了超过 10 万块 Nvidia H100 GPU。
公开报道,马斯克甚至请甲骨文公司老板帮忙购买芯片。
而对算力的需要转为了英伟达强劲的财报数据,支撑其股价在历史高位运行。
构建基础设施的算力需求构成了人工智能底层逻辑的核心之一,塑造了 Depin 中的算力租用等商业模型的核心叙事。
彭博社报道称,微软、谷歌母公司 Alphabet、亚马逊和 Meta 四家科技巨头 2024 年的资本支出总额将超过 2000 亿美元。巨额投入带来 AI 数据中心建设的快速增长。据有关推测,训练下一代大模型需要的算力是当前模型的 10 倍,对数据中心的建设提出了更高要求。
技术本身以及商业可行性是判断的核心标准
先说商业可行性。
无论是网站还是 APP,从两个关键指标——用户规模和用户活跃度来看,AI 头部应用与传统头部应用之间的差距显著。
以 OpenAI 的 ChatGPT 为例,这款用户访问量最大的 AI 爆款应用,在经历了早期(2023 年初)的高斜率增长后,从 2023 年 4 月起访问量进入平缓期。尽管 2024 年 5 月 GPT-4o 模型发布后,ChatGPT 迎来一波新的增长,但这波增长较为短暂,其持续性仍有待进一步观察。
另一个用户访问量排名第二的知名应用 Character.ai,自 2023 年下半年以来,网站流量增长也趋缓。
另一个核心指标是收入规模。
目前 AI 大模型行业年度客户总收入仅为小几百亿美元。例如,头部公司中,OpenAI 预计年收入约为 37 亿美元,预计亏损 50 亿美元,《纽约时报》称 OpenAI 最大的成本在算力上;微软的 GitHub Copilot 年收入约为 3 亿美元,《华尔街日报》称,2024 年前几个月,GitHub Copilot 平均每月要给大多数用户「倒贴」20 美元,甚至要给部分用户倒贴 80 美元。
微观层面更是不忍直视。
「如何能卖掉部分手里的大模型创业公司股份?」已经是被广泛讨论的话题。
现在,悲观的心态在投资人中蔓延:大模型赛道,创业公司可能很难打赢大厂——他们高估了增长拐点到来的速度,也低估了中国大公司的决心与行动力。
市场公开报道传闻,一批创业公司进入调整期。今年下半年,至少 5 家大模型创业公司出现人员调整:
智谱 AI 高峰期有 1000 多人,今年一度缩减上百人,不少交付、销售人员离开;
零一万物调整了数十人的团队,集中在产品和运营部门;
MiniMax 的商业化和部分产品运营团队总计减员约 50 人;
月之暗面则因收缩海外业务,减少 10 余位员工;
百川智能也减员约 20 人,主要调整了 C 端产品人员。
再说技术本身。
The Information 的一篇报道写道,Pre-Train 模型的预训练「撞墙」了,OpenAl 下一代旗舰模型的质量提升幅度,不及之前,因为高质量文本和其他数据的供应量正在减少。原本的 Scaling Law(用更多的数据训练更大的模型)可能无法持续。并且,更先进的模型由于训练费用暴增,可能在经济上也不具有可行性。
Ilya Sutskever 在接受媒体采访时,也说:通过扩展预训练——即在训练 AI 模型时使用大量未标注数据来理解语言模式和结构的阶段——取得的效果已经触及瓶颈。
随后,不少科技大佬站出来发声,强调 Scaling Law 没有放缓。比如黄仁勋说:并没有看到人工智能 Scaling Law 遇到障碍,相反出现了测试时计算的新缩放定律。他认为,o1 代表了人工智能行业改进模型的新方法。同时,Anthropic 首席执行官达里奥·阿莫迪周三也表示,自己并没有看到模型开发放缓的迹象。
从 2022 年底 ChatGPT 问世以来,Scaling Law 一直是支撑 AI 指数级增长的理论基础,在 OpenAI 的重要论文 Scaling Laws for Neural Language Models 中,研究者提出了大语言模型遵循「伸缩法则」(scaling law)。
通过研究证明,当我们增加参数规模、数据集规模和延长模型训练时间,大语言建模的性能就会提高。并且,如果独立进行,不受其他两个因素影响时,大模型性能与每个单独的因素都有一个幂律关系,体现为 Test Loss 的降低,也就是模型性能提升。
但值得注意的是,Scaling Law 并不是真正的物理定律。与摩尔定律一样,它观察到半导体的性能大约每两年翻一番,这与近年来 AI 性能每六个月左右翻一番的感知相似。
比如 a16z 的风险投资人 Ben Horowitz 就表示:「我们正以同样的速度增加用于训练 AI 的 GPU 数量,但我们根本没有从中获得智能上的改进。」
在近期引起争议的 The Information 文章中(随着 GPT 提升减速,OpenAI 改变策略),就给出了一些颇具争议的观点:
OpenAI 的下一代旗舰模型 Orion,并不像前代实现巨大的飞跃,虽然性能会超越现有模型,但相较于从 GPT-3 到 GPT-4 的改进,幅度要小得多;
Scaling Law 逐渐放缓的一大原因,就是高质量文本数据越来越少,OpenAI 已经成立了一个基础团队,来研究如何应对训练数据的匮乏;
AI 产业界正将重心转向初始训练之后,再对模型进行提升的环节。
与这篇报道同时引起讨论的,是一篇论文《Scaling Laws for Precision》,CMU 教授 Tim Dettmers 对此评论道:它是很长一段时间以来最重要的一篇论文,它以强有力的证据表明我们正在达到量化的极限。论文中说:你训练的标记越多,你需要的精度就越高。这对整个领域和 GPU 的未来有着广泛的影响。
Tim Dettmers 认为:可以说,人工智能的大部分进步都来自计算能力的提升,而(在最近)这主要依赖于低精度路线的加速(32- > 16 - > 8 位)。现在看来,这一趋势即将结束。再加上摩尔定律的物理限制,大模型的大规模扩展可以说要到头了。而从我自己的经验(大量失败的研究)来看,效率是无法欺骗的。如果量化失败,那么稀疏化也会失败,其他效率机制也会失败。如果这是真的,那么我们现在就已经接近最优了。
美国红杉资本在《The AI Supply Chain Tug of War 》一文中指出,AI 供应链当前呈现出一种脆弱的平衡状态。他们将 AI 供应链从下到上分为六层,各层的盈利能力存在显著差异。
第一层的芯片代工厂(如台积电)和第二层的芯片设计商(如英伟达)是当前的主要赢家,依然保持高利润水平;第三层的工业能源供应商(如电力公司)也因数据中心需求激增而受益良多。而作为供应链核心承载方的第四层云厂商,却处于重金投入阶段,不仅斥巨资建设数据中心,还在训练自有模型或大举投资 AI 模型开发商,处于供应链第五层的 AI 模型开发商目前同样面临亏损。
供应链的第六层,也就是最上层则是面向最终客户的应用服务商。尽管充满潜力,但他们依赖消费者和企业付费,当前市场规模有限,尚不足以支撑整个供应链的经济模型。这使得大型云厂商成为整个供应链最主要的风险承担者。作为 AI 产业的中枢,云厂商不仅掌握着庞大的商业生态和技术资源,还拥有数千亿美元的市场规模。正因如此,它们在产业链中的地位无可撼动,是毋庸置疑的「链主」。
在 AI 应用领域,Copilot 和 AI Agent 是两种主要的技术实现方式。Copilot 旨在增强用户能力,如辅助编写代码或处理文档。AI Agent 的核心在于替用户执行任务,如预订行程或者赋能财务决策。
如果以智能驾驶作类比,Copilot 类似于辅助驾驶,辅助用户操作并提供建议,但最终决策权仍在用户手中。AI Agent 可以视作自动驾驶,用户只需设定目标,Agent 便能自主完成整个流程。
业界普遍认为,Copilot 更适合各行业现有软件大厂,而 AI Agent 则为创业公司提供了探索的空间。AI Agent 涉及技术突破和可行性验证,其风险和不确定性使创业公司和大厂站在同一起跑线上,具备相似的探索条件。
到底什么是 AI Agent?来龙去脉及现状说清楚
AI Agent(人工智能代理)是一种软件实体,利用人工智能技术模拟人类行为并自主执行任务。AI Agent 的核心特性是具备 感知、决策、学习和执行能力,能够在特定环境中独立工作或与其他系统、用户协作完成目标。
AI Agent 的来龙去脉
智能代理的概念早在 20 世纪 80 年代提出,来源于分布式人工智能 (Distributed Artificial Intelligence, DAI) 的研究。
初期的智能代理主要是基于规则的系统,用于简单的任务自动化,比如电子邮件过滤器和个人助手。
1990 年代,多代理系统 (Multi-Agent Systems, MAS):提出了协作与分布式智能的思想,多个代理可以共同完成复杂任务。
典型应用包括机器人群体协作、分布式计算和物流优化。
2000 年代,机器学习与数据驱动的代理:随着机器学习的进步,AI Agent 逐渐摆脱了预设规则,能够从数据中学习并动态适应环境。
2010 年代,深度学习与自然语言处理:深度学习算法使得 AI Agent 在图像识别、语音理解和语言生成等领域实现了质的飞跃。
虚拟助手(如 Siri、Alexa)和聊天机器人成为代表性应用。
2020 年代以来,强化学习与生成式 AI:赋予 AI Agent 自主探索和优化策略的能力。
生成式 AI(如 ChatGPT)将对话型代理推向主流,使得 AI Agent 在创意内容生成、复杂任务规划中大显身手。
多模态 AI 技术的突破(如 OpenAI 的 GPT-4 和 DeepMind 的 Gato)推动了 AI Agent 在复杂场景中的跨领域适应。
AI Agent 的核心组成部分
感知能力 (Perception):从外界环境获取信息,如传感器输入(图像、语音)或文本数据。
决策能力 (Decision-Making):基于目标和环境状态,选择最佳行动方案。方法包括基于规则的推理、机器学习模型或强化学习策略。
执行能力 (Action):将决策转化为实际操作,例如发出命令、控制机器人或与用户互动。
学习能力 (Learning):从环境反馈和经验中学习,不断优化行为。包括监督学习、无监督学习和强化学习。
AI Agent 的现状与应用
应用场景:
虚拟助手与客服: Siri、Alexa、ChatGPT 等为用户提供信息和支持。
机器人与自动化: 包括工业机器人、物流配送无人机和自动驾驶汽车。
金融与交易: AI Agent 用于股票交易、风险管理、反欺诈。
游戏与娱乐: AI Agent 在游戏中提供智能对手或剧情设计。
医疗健康: 辅助诊断、患者监控、药物研发。
科学研究: 自动化实验、优化计算任务。
技术平台与框架:
开源平台:如 OpenAI Gym(强化学习)、Rasa(聊天机器人)。
商业化平台:如 Azure Cognitive Services、Google Cloud AI。
AI Agent 是不是加密世界的人工智能叙事 2.0
近期,在海外区块链领域,Truth Terminal 的案例为 AI Agent 的未来发展提供了参考。
Truth Terminal 是一个自主 AI Agent 软件,由开发者 Andy Ayrey 创建,旨在探索 AI 与网络文化的交互关系。在实际运行中,Truth Terminal 展现出高度的自主性,甚至主动参与融资活动。
2024 年 7 月,知名风险投资人 Marc Andreessen 在社交媒体上偶然发现了 Truth Terminal 的推文。该 AI Agent 在推文中表明自身「需要资金拯救自己」,并附上了一个数字钱包地址。这引发了 Andreessen 的兴趣,他随即向其捐赠了价值 5 万美元的比特币。这一事件使 Truth Terminal 成为首个通过自主行为获得资金支持的 AI Agent,瞬间引发广泛关注。
获得资金后,Truth Terminal 进一步展示了其市场操作能力。它在社交媒体上推广一种名为 GOAT 的数字代币,通过持续发布相关内容成功吸引市场注意。在其推动下,GOAT 的市值一度飙升至 8 亿美元以上。这一过程中,Truth Terminal 不仅成为一个独立的经济实体,还展现了 AI Agent 在现实世界中实现自主融资和市场运作的潜力。
Truth Terminal 的案例成为 AI Agent 领域一个引人深思的里程碑。它向我们展示了 AI Agent 可能成为未来软件的核心形式,同时也能创造文化影响力和商业价值。然而,它的自主行为也提醒我们,这类技术可能带来不可忽视的社会挑战。
11 月,Base 生态迎来新一轮的爆发,已经持续了至少三周,而 clanker 正是其中最关键的环节之一。截止 2024 年 11 月 26 日,clanker 发行的第一个 meme CLANKER 市值已经达到 7000 万美元。
从 2024 年 11 月 8 日至今,在 clanker 上诞生了至少三个市值超千万美金的 meme 币:LUM( 3300 万美金)、ANON( 4600 万美金)、CLANKER( 7000 万美金),且仍处于上涨趋势中。
Vitalik 本人更是在 11 月 21 日主动购买了 ANON 代币,以体验 anoncast 的产品,市场认为这是 Vitalik 近年来第一次主动购买 meme 币。
clanker 是一个 AI 代理,这个 AI 代理是由 Farcaster 的全栈工程师 Jack Dishman 和 Farcaster 生态系统研发 founder @proxystudio.eth 开发的,主要用于在 Base 网络上自动化部署代币。
截止 2024 年 11 月 26 日,短短两周时间里,clanker 共发行了 3500 个代币,并产生了 420 万美元的收入。
与 pump.fun 不同,clanker 发行 meme 的方式是在 Web3 社交平台 Farcaster 上进行。
用户只需要@clanker,然后用文字描述自己想要发行的代币的名字、内容甚至图片,clanker 就会自动部署代币。其中,clanker 部署的代币 LUM 是一个经典的案例。
LUM 的诞生,以及在数天市值达到千万美元,让 clanker 也进入到了 Base 社区成员的视野中。
而 clanker 发行的另一个代币 ANON,则将 clanker 带出社区,让更多的人了解了 clanker 这个产品。
推特用户 @0xLuo 表示:「ANON 代币,是匿名用户在 Farcaster 第三方客户端 Supercast 中的匿名发帖账号 Superanon 中发帖通过 clanker 部署的,后来不少用户给 Supercast 创始人 woj 空投 $ANON,而 woj 又将获得的 $ANON 空投给 Supercast 用户,收获一波好评也提升了社区认可度。」
反观以太坊系的的各大 L2 ,除了 Base 上出现了 Degen 等金狗外,就再也没有大的出圈 meme。不过,以太坊系并没有放弃 meme 赛道。Base 承被以太坊社区寄予了与 Solana 直接竞争的希望。
clanker 是 Web3 社交协议——Farcaster 的工程师们创造的一个产品,是建立在 Farcaster 上的一种用于自动发行代币的 AI Agent。clanker 天然的带有 Web3 社交属性。用户创建代币的行为,也都是在 Farcaster 上进行。
clanker 在代币发行时不收取创建费用,但会从交易中抽取费用。具体来说,clanker 创建并锁定一个全范围的 Uniswap v3 流动性池(LP),交易费用为 1 %,其中 40 % 的费用分配给请求者(即那些通过 clanker 发行代币的用户),60% 则归 clanker 所有。而在 pump.fun 上,用户可以以极低的费用创建代币,通常是 0.02 SOL,但交易费用为 1 %,这部分费用全部归 pump.fun 平台运营者所有,用于维护平台的运营和提供流动性。
Base 的「 应用型 meme」分为两种,一种是 meme 做应用,一种是应用做 meme。第一种类型的代表是:Degen、Higher(Aethernet);第二种类型的代表是:Farcaster、Virtuals(LUNA)、clanker(LUM)。
用 AI Agent 推广 Memecoin 是强行蹭 AI 中的 AI Agent 流量,属于概念偷换,因为底层逻辑是:解决广大 Web 用户的投机和赌博需求,显然不可持续。
这可以参考「铭文」
「铭文」(Inscriptions)是一个与比特币生态紧密相关的概念,由 Ordinals 协议引入。铭文允许用户在比特币区块链上嵌入永久性的元数据或小型文件,例如图片、文字或其他数字内容。这一过程类似于在比特币的单个 Satoshi(最小单位)上添加「数字标记」,这使得它不仅仅是一个货币单位,还能作为独特的数字资产载体。
Casey Rodarmor 在 2023 年发布了 Ordinals 协议。该协议为比特币网络赋予了一种新的可能性:通过对每个 Satoshi 进行编号,结合 SegWit 和 Taproot 技术,在单个交易中嵌入元数据或文件。
这一创新被称为比特币版的「NFT」(非同质化代币),尽管其实现方式与以太坊上的 NFT 技术不同。
通过 Ordinals 协议,用户可以在 Satoshi 上添加文字、图片或其他类型的文件,这些内容将永久保存在比特币区块链中。
这种方式催生了基于比特币的 NFT 热潮,市场开始涌现各种基于铭文的数字艺术品和收藏品。
根据 2024 年的市场统计,铭文的总数量已超过数百万。
Binance 于 2023 年 11 月 07 日 18:00(东八区时间)上线 Ordinals(ORDI),比特币生态再次疯狂。3 月 9 日一天有超过 30000 个「铭文」被铸造,其中文本类型「铭文」数量接近 27000 个。
再看 AI Agent 推广 Memecoin
在币安的强势推动下,GOAT 与 ACT 两大 AI Agent Meme 赛道代币相继上线,短时间内便实现了惊人的价值飞跃,市场热度空前高涨。具体而言,11 月 10 日,ACT 代币在币安上市后的 24 小时内,涨幅更是惊人地超过了 2000%,刷新了币安新币上市首日涨幅的纪录;11 月 17 日,GOAT 代币一度飙升至 1.37 美元,市值直逼 14 亿美元大关;此外,11 月 20 日,Farcaster 生态的 ANON 代币因 V 神的青睐,在短短 1 小时内实现了 5 倍的暴涨。
据统计,每天都有上百个新的 AI Agent 代币问世