特斯拉的 Dojo 处理器已进入量产阶段,即将投入使用。Dojo 是一种晶圆处理器上的系统,由 5×5 的一系列单独处理器芯片组成,这些芯片固定在另一片称为载体晶圆的晶圆上,并通过台湾半导体的 InFo 技术进行晶圆互连。听起来很复杂?让我们简化一下。

特斯拉的 Dojo 即将部署

Tesla Dojo Training Tile(该公司称之为训​​练瓷砖)实际上是一组 25 个强大的处理器,它们连接在一起作为一个超强大的处理器,利用台积电专为高速连接而设计的连接技术。现在它开始有点有意义了,但首先要介绍一下为什么特斯拉需要自己的处理器,而 Nvidia、IBM 和英特尔等半导体巨头已经在为计算机和人工智能制造硬件了。

特斯拉决定进军人工智能、芯片设计和超级计算领域,表明该公司,尤其是埃隆·马斯克,认为创新不仅仅是企业业务的扩张。特斯拉从一开始就试图开发具有自动驾驶功能的汽车,它销售的所有汽车都会向特斯拉传输数据,以帮助该公司建立系统。因此 Dojo 也是其垂直整合的一部分。

Dojo 与其他可用的 AI 加速器和超级计算工具截然不同。例如,Nvidia 的 A100 或 A200 GPU 嵌入在世界各地的许多超级计算机中,但这些和其他产品大多旨在满足广泛的任务,包括研究、大数据处理、复杂模拟等等。但 Dojo 是为特定任务而设计的,例如由现实世界数据驱动的 AI 计算机视觉;Dojo 还能做什么尚不得而知,因为该公司没有透露太多信息。

基于晶圆的系统效率更高

来源:台积电。

如上所述,Dojo 由 25 个独立的高性能处理器组成,因此它对电力的需求非常大,需要高效而复杂的冷却系统。根据 Tom 的硬件介绍,为了供电,Tesla 使用了一个电压调节系统,该系统本身就是一个复杂的模块,可为处理器提供 18,000 安培的电力。在如此高功率水平下,系统会散发 15,000 瓦的热量,为了高效工作,它需要一个液体冷却系统。

基于晶圆的加速器(例如 Tesla 的 Dojo)比其他多处理器系统效率更高、性能更佳。它们的优势在于通信核心之间的低延迟、高带宽以及系统晶圆技术带来的更高能效。

到目前为止,只有特斯拉和 Cerebras 拥有晶圆系统设计,但其他行业参与者也有望加入,因为效率更高、延迟更低。然而,这些加速器也存在一些局限性;晶圆系统目前必须依赖片上内存,而片上内存通常是固定的,可能不足以满足不同类型的用例。但预计当下一代晶圆平台能够在加速器块上实现 HBM4 内存芯片的 3D 堆叠时,这一问题将得到克服。