ロスアラモス国立研究所 (LANL) は、Venado スーパーコンピューターを初公開しました。このスーパーコンピューターは 10 エクサフロップスのパフォーマンスが可能で、特にエネルギー部門の AI ワークロード向けに設計されています。このスーパーコンピューターは、基礎科学研究と国家安全保障のために人工知能と機械学習を統合するために使用されます。

ニコラス C. メトロポリス モデリングおよびシミュレーション センターに設置された Venado は、ロスアラモス国立研究所が Nvidia および Hewlett Packard Enterprise (HPE) と共同で設計および設置したものです。

ベナドスーパーコンピュータの容量とアーキテクチャ

ニューメキシコ LANL に設置された Venado スーパーコンピューターには、Nvidia の Grace Hopper スーパーチップ 2560 個と Hewlett Packard Enterprise 独自の Slingshot 11 ネットワーク接続が搭載されており、スーパーコンピューターの AI 計算要件に合わせて特別に設計されています。Venado は、Nvidia が設計したスーパーチップを使用して構築された最初のスーパーコンピューターの 1 つでもあります。

このシステムは完全に液体冷却されており、920個のGrace-Grace CPUと2560個のGH200(Grace Hopper)スーパーチップ、合計3480個のNvidiaスーパーチップを搭載しています。GH200はAIタスクを処理するためのメインシステムモジュールで、72コアのGrace CPUと480GBのメモリを備えています。Grace CPUは、GPUを2つ目のGrace CPUに交換することで、1秒あたり1TBの帯域幅を実現します。LANLディレクターのトム・メイソン氏は次のように述べています。

「ベナドは、国家安全保障と基礎研究を前進させる最先端のスーパーコンピューティングに貢献し、人工知能を統合してこれらの課題に対処する方法を加速させるでしょう。」

出典: LANL。

出典:ストレーツリサーチ。ベナドはLANLの期待に応える

Venado は、Nvidia Grace Hopper スーパーチップ、Nvidia Arm ベースのスーパーコンピューティングユニット、Nvidia Hopper アーキテクチャを搭載し、大規模な人工知能アプリケーションを処理できるにもかかわらず、システム全体は非常にコンパクトです。初期のテストでは、Venado が天体物理学のシミュレーションや材料科学のシミュレーションで大きな成果を生み出せることが示されています。焦点は、極度の精度ではなく、ワークフローの効率にあります。

Venado は、大規模な言語モデル処理に適した強力なスーパーコンピュータです。10 エクサフロップスというスコアは、精度を犠牲にしてより高いフロー レートまたは処理速度を実現したものとされていますが、これは LLM に必要なものであり、人工知能に適した候補です。しかし、AMD Frontier システムと比較すると、まだ匹敵するほどではありませんが、決して「スローポーク ピストン」ではありません。人工知能の要件により現在求められている、精度の低いワークロードの管理には十分対応できます。米国エネルギー省の副長官である David Turk 氏は、次のように述べています。

「私たちのスーパーコンピューティング能力は、国立研究所が重要な問題に取り組む上で重要な要素となります。」

さらに付け加えると、

「人工知能のアプローチを組み込む能力により、ロスアラモスのベナドシステムが関心領域に対してどのように新しい有意義な結果をもたらすことができるかを見るのが楽しみです。」

出典: LANL。

Venado は、さまざまなベンダーの専門知識を組み合わせた共同設計の素晴らしい例です。LANL は、特にバイデン政権下で連邦政府からかなりの支援を受けています。米国政府は人工知能を真剣に受け止め、機械学習に関する研究開発を優先しています。Venado は 2560 個の Nvidia GH200 スーパーチップを搭載した強力なスーパーコンピューターですが、英国政府のプロジェクト Isambard には同じスーパーチップが 5448 個搭載され、今年デビューする予定です。

ロスアラモス国立研究所のメモはこちらをご覧ください。