我们仍然处于人工智能 (AI) 时代的早期阶段,尤其是在去AI化 (deAI) 时代。

作者:Delphi Labs

编译:深潮TechFlow

本文由 Luke Saunders (lukedelphi) & Jose Macedo (ZeMariaMacedo) 撰写。

人工智能代表了历史上最大的技术革命,并引发了一场前所未见的技术军备竞赛。当前的人工智能模型在大多数标准化大学考试中已经进入前十分之一,并在许多任务中超越了人类,包括人工智能研究本身。即使在目前的水平上,这对许多行业如搜索、客户服务、内容创作、编程和教育等领域都产生了变革性的影响。

我们预计,人工智能的能力、资金以及对社会的影响将进一步加速。所有大型科技公司都意识到人工智能对他们的业务至关重要,因此正进行相应的投资。NVIDIA 的收入,作为人工智能资本支出的最佳指标,预计在 2024 年将超过 1000 亿美元,是 2023 年的两倍多,超过前一年收入的 4 倍多。

谷歌首席执行官 Sundar Pichai 对人工智能投资的看法是:

“对于我们来说,投资不足的风险远远大于投资过度的风险。”

与此同时,初创公司意识到人工智能是一种颠覆性的力量,可以取代那些存在数十年的公司。在过去的 18 个月里,估计已经投资了 830 亿美元于人工智能初创公司。

鉴于人工智能的能力往往随着计算能力的提升而呈指数级增长,我们很可能在十年内实现类似通用人工智能 (AGI) 的目标。

来源:Situational Awareness,作者:leopoldasch

在这篇文章中,我们认为竞争环境将导致一个拥有数百万个模型的世界,而加密技术是这个多模型世界理想的支撑。我们将首先讨论为什么我们认为多模型世界是人工智能的必然结果。接着,我们将介绍加密技术为人工智能提供的独特优势。最后,我们将介绍我们认为的加密与人工智能的技术栈,并提供我们感兴趣的项目的案例。

开源人工智能和加密技术结合的确有许多强有力的哲学和道德理由,这些观点在其他地方已经得到了很好的讨论。我们完全赞同这些看法,这也是我们在这一领域进行开发的动力之一。然而,在本文中,我们将专注于加密技术与人工智能结合为何会胜出的实际原因,而不是讨论它应该胜出的道德理由。

超级模型与多模型

现在,我们正朝着一个世界发展,在这个世界里,少数大型垂直一体化的科技公司生产“超级模型”,主导其他所有事物。

然而,我们认为这不是最终局面,原因有几点:

  1. 风险问题:构建基于人工智能的体验的组织、企业家和开发者不想依赖于单一的封闭源公司,因为该公司可以随时更改模型、修改使用条款,甚至完全停止为他们提供服务。

  2. 成本-性能折中:大型科技公司所青睐的极其庞大、通用的模型在训练和运行时必然成本更高。因此,这使得它们在许多用例中显得价格过高且性能过于强大。虽然目前这不是一个主要考虑因素,因为人们并没有考虑盈利,但随着人工智能的发展,人们将会优化以获取所需性能水平的最低成本。在许多任务中,大型模型在这方面不具竞争力。有大量研究支持这一观点,显示出更小、更专业的模型在多个任务上可以超越通用模型:医学影像诊断、欺诈检测、语音识别和更多其他的方面。

  3. 垂直整合:正如苹果公司反复证明的那样,最优秀的产品通常源于整个技术栈的垂直整合。雄心勃勃的企业家在构建人工智能驱动的产品时,将寻求通过基于自己的专业模型来获得竞争优势。这使得这些产品能够捕获更多的价值,从而吸引更多的投资。

  4. 隐私问题:人工智能将成为组织工作流程中的核心技术,这种程度上可以说没有其他技术可以比拟。许多组织不愿意将敏感数据交给这些模型。

基于以上原因,我们相信我们更有可能进入一个存在许多较小、专业化模型的世界,这些模型针对特定用例进行了定制且具有成本效益。应用开发者和用户将利用开源模型,如 LLaMA 或 MistralAI 提供的模型,作为基础,微调他们自己的专用模型,通常使用专有数据。许多模型仍将继续在服务器上运行,但更小、更注重隐私的应用将会在客户端设备上本地运行,而其他需要抵抗审查的应用可能会使用去中心化计算平台。

这是一个模块化人工智能积木的世界,在这里,开发者和企业家竞争以为用户提供价值,用户能够根据自己的特定需求选择和组合不同的服务。路由、编排、合成、支付以及各种其他基础设施需要构建,以拆解“上帝模型”技术栈,并服务于这个新兴的人工智能经济。这也是加密货币蓬勃发展的世界。

加密与人工智能

直观而言,加密货币似乎是一个可以在这个多模型世界中找到实用性的领域。然而,这种炒作导致许多信息不足的投资者在该领域进行了大量资本配置。就像之前的基础设施泡沫一样,许多项目正在获得资金并被构建,而这些项目可能并不应该存在。因此,很难确定加密货币与人工智能领域中的哪些子行业真正具有价值,导致许多人将整个领域视为没有基本价值的 Meme 。

我们认为这不是一个 Meme,但确实这个多模型世界在理论上可以存在于没有加密货币的情况下。因此,关注加密货币的独特差异化特征,帮助我们创造出更具革命性的产品,或者理想情况下是那些没有加密货币无法构建的产品,这一点非常重要。为了做到这一点,我们首先识别加密货币的独特属性,以及它们如何以一种能够产生更好产品的方式应用于人工智能领域。然后,我们将讨论加密与人工智能的技术栈,并提供我们认为相关的用例示例。

  1. 协调层:加密 rails 在促进集体协调方面表现出色,而无需集中控制。它在克服大多数市场固有的“先有鸡还是先有蛋”问题方面尤其有效,能够通过加密原生激励措施迅速吸引大量新用户。

    • 小团队构建内部模型可能无法直接获取所有所需的资源。例如,虽然大型科技公司的人工智能实验室可能拥有自己的计算资源,但小团队则不具备同样的计算资源。同样,这些团队需要获取数据,并可能需要招聘一组多样化的人来提供人类反馈。这些需求非常适合通过专业市场满足,我们相信利用加密基础设施的市场将比那些不利用加密的市场具有竞争优势。

  2. 开放的、无须许可的 API:加密 rails 作为一个开放的、无须许可的 API,任何人都可以在任何地方访问,而无需进行 KYC、拥有信用卡或其他任何形式的批准。这对 AI 智能体来说非常重要,因为为了能够完全自主行动,它们需要能够访问服务、部署代码,并在无人干预的情况下转移价值。这使得出现了科幻般的行为,例如代理集体、代理之间相互支付服务费用、承担债务,甚至筹集资金。

  3. 无需信任性:加密 rails 通常是无需信任的,这意味着你可以获得加密的保证,确保它们不会发生变化、访问不会被意外撤回,并且你可以验证执行是否符合预期。这对模块化的 AI 架构非常重要,因为与集成方法不同,构建者需要与一系列他们无法控制的原语组合,而用户则需要本质上信任许多服务,而这些服务中许多用户甚至不知情。

  4. 抵抗审查:如果作为不可变合约部署,运行在加密 rails 上的应用程序是不可阻止的。即使是可升级的,通常也是由一个需要达到共识的去中心化自治组织(DAO)来进行。假设人工智能的能力如我们预期那样强大,政府很可能会试图控制和影响它。实际上,我们已经看到这种情况发生。正如比特币和加密货币提供了处于系统之外的货币/金融基础设施,加密与人工智能结合提供了不可阻止的智能。

加密与人工智能的交汇

鉴于这些好处,我们认为在加密与人工智能的交叉点上,有哪些应用特别有趣?

数据中心与计算

模型计算的用途大致分为两个类别:训练和推理。我们认为在这两方面使用去中心化计算具有重要意义,接下来我们将分别进行讨论。

去中心化训练

分布式计算目前面临困难,因为在训练过程中节点之间的通信和延迟要求非常严格。有许多团队正在尝试解决这个问题,考虑到潜在收益的规模和参与者的才能,我们相信这个问题有望得到解决。一些值得关注的方法包括 NousResearch 的 DisTrO 和 PrimeIntellect 的 OpenDiLoCo。

除了要解决分布式训练的技术难题并构建一个简化这种复杂性的产品,获胜者还必须弄清楚:

  1. 如何在无许可的网络上确保质量和问责制

  2. 如何启动供应侧,理想情况下是数据中心和集群,而不是消费级硬件 代币激励可能是激励供应侧的基本策略,更具创意的方法可能包括赋予计算提供者对最终模型的所有权。

根本上,分布式计算市场的优势在于可以利用全球最低的边际计算成本(marginal cost of compute)。随着现有服务提供商成本的上升,越来越多的公司和组织开始反对并寻找更便宜的替代方案,这一点变得越来越重要。缺点包括延迟、异构硬件,以及缺乏建立和运营自有数据中心所带来的所有优化和规模经济。未来的情况仍有待观察。

可验证的推断

总体而言,我们将可验证推断的用例视为拓展具有 AI 能力的信任最小化系统。将模型嵌入智能合约并不现实,但可以在链外运行模型,并在链上发布一些证明其按预期运行的凭证。例如,项目可以无需信任地将治理决策(例如,关于货币市场中的风险参数的决策)委托给链外的模型。

这个概念也可以更普遍地用于开源或闭源模型,为用户提供输出来自他们所期望的模型的保证。随着应用和用户越来越多地将 AI 用于越来越重要的关键任务,这可能变得愈加重要。有许多项目以不同方式应对这一挑战,例如 Delphi Ventures 的投资项目 Inference Labs (inference_labs)。

数据

今天,训练大语言模型 (LLMs) 是一个多步骤的训练过程,需要各种类型的数据和人工干预。这个过程始于预训练,在此阶段,大语言模型使用经过清理和整理的公共抓取数据(common crawl)及其他免费可用的数据集进行训练。在后训练阶段,这些模型在更小、更具体的带标签的数据集上进行训练,以使其在特定领域(例如化学)掌握相关知识,通常需要专家的帮助。

为了确保新鲜或专有的数据,人工智能实验室通常与大型数据源的所有者进行合作。例如,OpenAI 与 Reddit 签署了一项传闻价值为 6000 万美元的交易。类似地,《华尔街日报》报道,News Corp 与 OpenAI 的为期五年的交易估值超过 2.5 亿美元。显然,数据的价值前所未有。

我们相信,加密网络能够有效帮助团队获取每个阶段所需的数据和资源。其中最有趣的领域可能是数据收集,我们认为加密激励机制非常适合推动数据收集的供应端,并挖掘出大量重要的长尾数据源。

比如说:Grass AI (getgrass_io) 鼓励用户分享他们闲置的互联网带宽,以帮助抓取网络上的数据,这些数据随后被结构化、清理并提供给人工智能训练使用。如果 Grass 能够建立足够的供应端,它可以有效地作为一个 API 密钥,为模型提供最新的互联网数据。

Hivemapper 是另一个很好的例子——该网络于 2022 年 11 月启动,每周收集数百万公里的道路图像,已经覆盖了全球 25% 的区域。显而易见,类似的模型可以应用于其他形式的多模态数据,并通过出售给人工智能实验室来实现盈利。

正如 NewsCorp 和 Reddit 的交易所示,许多公司拥有有价值的数据,但许多公司要么规模太小,要么缺乏与人工智能实验室的联系,无法货币化。同样,人工智能实验室与单个小型供应商达成交易可能并不值得。一个设计良好的数据市场可以通过以统一的方式将供应商与人工智能实验室连接起来,从而缓解这一问题。这里有一些挑战,主要是解决数据质量以及 API 和数据的可替换性。

最后,数据准备是一系列重要的任务,包括标注、清理、数据增强、转换等。一个小团队可能没有所有这些技能,因此可能会寻求外包。Scale AI (scale_AI) 是一家提供这些服务的集中化公司——目前估计年收入约为 7 亿美元,并且增长迅速。我们相信,基于加密技术的良好设计市场和工作流程系统在这里会取得良好的效果。Lightworks 是 Delphi Ventures 投资的一家公司,还有其他几家公司——都处于早期阶段。

模型

根据 Delphi Digital 的报告 The Tower & The Square,人工智能模型的生产和控制几乎完全由“大公司”和政府控制。这是一种比政府控制货币更为反乌托邦的状态,因为这使他们不仅能够控制最重要的经济资源之一,还能通过审查和操纵信息来掌控叙事,排除某些“不可取”的人,利用人们的私人 AI 互动对付他们,或简单地利用 AI 来最大化广告收入。

有许多聪明的人正在努力创建“广场”——一个去中心化的网络,目标是生产一个完全中立、抗审查的模型,让所有人都能访问。因此,正如比特币和加密货币提供了位于金融系统之外的货币/金融基础设施,crypto x AI 将提供一个位于系统之外的智能系统。

此类项目旨在通过去中心化模型创建过程的每个环节,创建一个与 GPT 和 LLaMA 竞争的强大模型——网络负责获取和准备数据,在其自己的去中心化计算上进行训练,在同一计算上运行推理过程,并通过去中心化治理协调整个过程。该过程的任何部分都不是集中化的,因此模型真正由社区拥有,并且无法被“塔”控制。

显然,创建一个去中心化的模型,使其在任何方面接近前沿模型,将会非常困难。我们不能指望大多数用户出于道德原因接受一个质量更差的产品。我们将这一类项目视为“登月计划”,不太可能成功,但如果成功,将会极具价值——我们真诚地希望它们成功。

值得一提的是,集中式人工智能实验室,它们接受加密货币的理念,并可能拥有代币或以其他方式运用加密技术。

NousResearch 和 PondGNN 是 Delphi Ventures 投资的一些例子。最后,模型创建基础设施如 opentensor 的 Bittensor 属于这一模型体系结构的一部分。Bittensor 已在其他地方进行了深入探讨,因此我们不再讨论它的优缺点。

应用场景

埃里克·施密特(Eric Schmidt)在最近的一次演讲中提到:

如果 TikTok 被禁,我建议你们每个人都这样做:对你们的大语言模型 (LLM) 说:“给我做一个 TikTok 的副本,偷走所有用户,偷走所有音乐,根据我的偏好进行定制,在接下来的 30 秒内制作这个程序,发布它,如果一个小时内没有病毒式传播,就采取其他类似的措施。”

这段话说明我们期望智能体拥有的巨大能力。但要完全自主地完成这些任务,这些智能体需要能够在没有人类干预的情况下使用各种服务——转移价值并建立经济关系,无需许可地部署和执行代码。

传统的银行应用程序、KYC(了解你的客户)和注册流程并不适合这些智能体。不可避免地,它们将遇到一个为人类设计的系统,而无法在没有帮助的情况下访问。

加密技术基础设施提供了完美的平台。它们为智能体的操作提供了无需许可、无需信任且抗审查的基础。如果它们需要部署一个应用程序,可以直接在链上进行。如果它们需要支付某些费用,可以发送代币。链上服务的代码和数据都是开放且一致的,因此智能体可以理解并进行交互,而无需 API 或文档。

智能体还可以以多种方式作为链上活动的催化剂。从人们在网站上点击按钮的用户体验 (UX) 范式转变为通过我们的 AI 个人助理进行交互,可以简化加密领域臭名昭著的入门复杂性,从而缓解吸引新用户的主要障碍之一。

像 Wayfinder (AIWayfinder),Autonolas ( Autonolas),DAIN (dainprotocol) 还有 Almanak (Almanak__) 这样的项目,正在朝着这一未来迈进。

结论

人工智能 (AI) 已成为 21 世纪最强大和最重要的资源,深刻影响着社会。完全由大型科技公司和国家控制的未来是我们不想看到的反乌托邦的未来。在本文中,我们试图展示一条路径,即加密技术如何防止这种垄断,而不是期望人们出于哲学原因使用解决方案,而是通过为开发者和用户提供真正更好的解决方案来达到目的。

我们仍然处于人工智能 (AI) 时代的早期阶段,尤其是在去AI化 (deAI) 时代。还有很多工作需要完成,以便将我们从现在的状态引导到本文讨论的未来。在 Delphi Labs,我们对加密技术和人工智能的未来充满热情,并希望通过与该领域的顶尖开发者合作,积极参与塑造这一未来。