配備4608顆H100 輝達展示超級電腦Eos 為AI開發設計

輝達 (NVDA-US) 周四發布了一段影片,首次讓公眾一睹 Eos 的架構,Eos 是其最新的面向企業的超級計算機,專為數據中心規模的高級人工智慧開發而設計,也是該公司最快的人工智慧超級電腦。

Eos 電腦目前由輝達自己使用,在最新的 Top 500 榜單中,它被評為世界上性能最高的超級電腦的第 9 位,該榜單以 FP64 為衡量標準。在純人工智慧任務中,它很可能是速度最快的超級電腦之一。

同時,它的藍圖也可以用來為其他公司建構以企業為導向的超級電腦。

Eos 在 2023 年 11 月的 Supercomputing 2023 大會 (SC23) 上亮相,以希臘女神 Eos 命名,據說她每天打開黎明的大門,這彰顯了輝達對推進 AI 技術的承諾。

輝達在影片中表示:「每天,EOS 都在迎接輝達數千名從事人工智慧研究的內部開發人員的挑戰,幫助他們解決以前無法解決的問題。」

輝達的 Eos 配備了 576 個 DGX H100 系統,每個系統包含 8 個 輝達 H100 GPU,用於人工智慧 (AI) 和高效能運算 (HPC) 工作負載。 該系統總共配備了 1,152 個 Intel Xeon Platinum 8480C(每個 CPU 56 個核心) 處理器以及 4,608 個 H100 GPU,使 Eos 能夠在 HPC 和 AI 方面分別實現令人印象深刻的 Rmax 121.4 FP64 PetaFLOPS 和 AI18.4 88 性能。

Eos(依託於 DGX SuperPOD 架構) 的設計專為人工智慧工作負載和可擴展性而打造,因此它採用了輝達的 Mellanox Quantum-2 InfiniBand with In-Network Computing 技術,該技術的數據傳輸速度高達 400 Gb /s,這對於有效訓練大型人工智慧模型和擴大規模至關重要。

輝達表示,除了強大的硬體之外,輝達的 Eos 還配備了強大的軟體,同樣是專門為人工智慧開發和部署而建置的。 因此,輝達的 Eos 可以解決各種應用程序,從類似 ChatGPT 的生成式 AI 到 AI 工廠。

輝達在影片中表示:「Eos 擁有一個整合的軟體堆疊,其中包括人工智慧開發和部署軟體,包括編排和叢集管理、加速運算儲存和網路庫,以及針對人工智慧工作負載優化的作業系統。」 

輝達未透露 Eos 的成本是多少,而且 NVIDIA  DGX H100 系統的定價是保密的,取決於許多因素,例如數量,這也無濟於事。同時,考慮到每台 NVIDIA  H100 的成本可能在 3 萬至 4 萬美元之間,這取決於數量,因此可以大致估測出其有多昂貴。

輝達認為,隨著世界各地的企業和開發人員尋求利用 AI 的力量,Eos 成為一種關鍵資源,有望加速實現能為每個組織提供動力的 AI 驅動應用進程。