特斯拉的 Dojo 處理器已進入量產階段,即將投入使用。Dojo 是一種晶圓處理器上的系統,由 5×5 的一系列單獨處理器芯片組成,這些芯片固定在另一片稱爲載體晶圓的晶圓上,並通過臺灣半導體的 InFo 技術進行晶圓互連。聽起來很複雜?讓我們簡化一下。

特斯拉的 Dojo 即將部署

Tesla Dojo Training Tile(該公司稱之爲訓​​練瓷磚)實際上是一組 25 個強大的處理器,它們連接在一起作爲一個超強大的處理器,利用臺積電專爲高速連接而設計的連接技術。現在它開始有點有意義了,但首先要介紹一下爲什麼特斯拉需要自己的處理器,而 Nvidia、IBM 和英特爾等半導體巨頭已經在爲計算機和人工智能製造硬件了。

特斯拉決定進軍人工智能、芯片設計和超級計算領域,表明該公司,尤其是埃隆·馬斯克,認爲創新不僅僅是企業業務的擴張。特斯拉從一開始就試圖開發具有自動駕駛功能的汽車,它銷售的所有汽車都會向特斯拉傳輸數據,以幫助該公司建立系統。因此 Dojo 也是其垂直整合的一部分。

Dojo 與其他可用的 AI 加速器和超級計算工具截然不同。例如,Nvidia 的 A100 或 A200 GPU 嵌入在世界各地的許多超級計算機中,但這些和其他產品大多旨在滿足廣泛的任務,包括研究、大數據處理、複雜模擬等等。但 Dojo 是爲特定任務而設計的,例如由現實世界數據驅動的 AI 計算機視覺;Dojo 還能做什麼尚不得而知,因爲該公司沒有透露太多信息。

基於晶圓的系統效率更高

來源:臺積電。

如上所述,Dojo 由 25 個獨立的高性能處理器組成,因此它對電力的需求非常大,需要高效而複雜的冷卻系統。根據 Tom 的硬件介紹,爲了供電,Tesla 使用了一個電壓調節系統,該系統本身就是一個複雜的模塊,可爲處理器提供 18,000 安培的電力。在如此高功率水平下,系統會散發 15,000 瓦的熱量,爲了高效工作,它需要一個液體冷卻系統。

基於晶圓的加速器(例如 Tesla 的 Dojo)比其他多處理器系統效率更高、性能更佳。它們的優勢在於通信核心之間的低延遲、高帶寬以及系統晶圓技術帶來的更高能效。

到目前爲止,只有特斯拉和 Cerebras 擁有晶圓系統設計,但其他行業參與者也有望加入,因爲效率更高、延遲更低。然而,這些加速器也存在一些侷限性;晶圓系統目前必須依賴片上內存,而片上內存通常是固定的,可能不足以滿足不同類型的用例。但預計當下一代晶圓平臺能夠在加速器塊上實現 HBM4 內存芯片的 3D 堆疊時,這一問題將得到克服。