洛斯阿拉莫斯國家實驗室 (LANL) 推出了 Venado 超級計算機。該超級計算機擁有每秒 10 億億次浮點運算的性能,專爲能源部門的 AI 工作負載而設計。該超級計算機將用於整合人工智能和機器學習,用於基礎科學研究和國家安全。

Venado 安裝在尼古拉斯 C. 大都會建模和仿真中心,由洛斯阿拉莫斯國家實驗室與 Nvidia 和惠普企業 (HPE) 合作設計和安裝。

Venado 超級計算機的容量和架構

Venado 超級計算機駐紮在新墨西哥州洛斯阿拉莫斯國家實驗室,配備了 2560 顆 Nvidia Grace Hopper 超級芯片和惠普企業專有的 Slingshot 11 網絡連接,專爲超級計算機的 AI 計算需求而設計。Venado 也是首批採用 Nvidia 設計的超級芯片打造的超級計算機之一。

該系統完全採用液冷,擁有 920 個 Grace-Grace CPU 和 2560 個 GH200(Grace Hopper)超級芯片,總共 3480 個 Nvidia 超級芯片。GH200 是處理 AI 任務的主要系統模塊,它有一個 72 核 Grace CPU 和 480GB 內存。Grace CPU 的帶寬可達每秒 1TB,因爲它們將 GPU 換成了第二個 Grace CPU。LANL 主任 Thom Mason 表示,

“Venado 增強了我們的尖端超級計算能力,推動了國家安全和基礎研究的發展,並將加速我們整合人工智能來應對這些挑戰。”

資料來源:LANL。

資料來源:海峽研究。Venado 不負洛斯阿拉莫斯國家實驗室的期望

儘管 Venado 能夠憑藉其 Nvidia Grace Hopper 超級芯片、基於 Nvidia Arm 的超級計算單元和 Nvidia Hopper 架構處理超大規模人工智能應用,但整個系統仍然非常緊湊。早期測試表明,Venado 可以在天體物理學模擬和材料科學模擬中產生顯著的結果。重點是工作流程效率,而不是極端準確性。

Venado 是一款功能強大的超級計算機,適合處理大型語言模型,它聲稱的 10 exaflops 的得分是通過犧牲準確性來換取更高的流速或處理速度,但這正是 LLM 的要求,因此是人工智能的合適候選者。但與 AMD Frontier 系統相比,它仍然不是對手,但絕不是“慢速活塞”。因爲它在管理較低精度的工作負載方面表現不錯,這是人工智能要求的當今需求。美國能源部副部長 David Turk 表示,

“我們的超級計算能力是國家實驗室解決重要問題的關鍵組成部分。”

此外,

“憑藉其融入人工智能方法的能力,我們期待看到洛斯阿拉莫斯的 Venado 系統如何爲我們感興趣的領域提供新的、有意義的成果。”

資料來源:LANL。

Venado 是不同供應商的專業知識共同設計的一個很好的例子。洛斯阿拉莫斯國家實驗室一直得到聯邦政府的大量支持,尤其是在拜登政府的領導下。美國政府非常重視人工智能,並且一直傾向於機器學習方面的研究和開發。Venado 是一臺強大的超級計算機,擁有 2560 個 Nvidia GH200 超級芯片,但英國政府的 Isambard 項目將容納 5448 個相同的超級芯片,預計將於今年首次亮相。

洛斯阿拉莫斯國家實驗室的註釋請見此處。