25顆晶片合一:特斯拉的下一代Dojo AI訓練模組已投入量產

特斯拉 (TSLA-US) 近期宣布,用於人工智慧訓練的 Dojo 晶片現已投入量產,並有望很快部署。有關巨型處理器的更多細節將繼續公布。

馬斯克 (Elon Musk) 的偉大計畫,賣車只是小部分,軟體才是真正獲利關鍵。在台積電 (2330-TW) 的北美科技研討會上正式宣布,特斯拉次世代 Dojo 訓練模組開始生產,到 2027 年將提供更複雜的晶圓級系統,算力是現有系統 40 倍以上。

特斯拉設計的 Dojo 超級電腦,核心在於訓練模組 (稱之為 Dojo Training Tile) 依賴於放置在載體晶圓,並使用台積電的整合扇出 (InFO) 技術進行晶圓級互連 (InFO_SoW) 互連。根據 IEEE Spectrum 報告,InFO_SoW 技術旨在實現高效能連接,使得 Tesla Dojo 的 25 個晶片可以像單一處理器一樣運作。同時,為了使晶圓級處理器保持一致,台積電用虛擬晶片填滿了晶片之間的空白點。

由於 Tesla Dojo Training Tile 本質上包含 25 個超高性能處理器,因此它非常耗電,並且需要複雜的冷卻系統。為了為晶圓上系統供電,特斯拉使用了高度複雜的電壓調節模組,為計算平面提供 18000 安培的電力。後者散發的熱量高達 15000W,因此需要液體冷卻。

特斯拉尚未透露其 Dojo 晶圓系統的性能—不過,考慮到其開發過程中面臨的所有挑戰,它似乎有望成為人工智慧訓練的一個非常強大的解決方案。

根據馬斯克的說法,如果輝達 (NVDA-US) 提供夠多 GPU,特斯拉大概不需要自行開發 Dojo,初步估計這批世代 Dojo 超級電腦,會成為特斯拉新 Dojo 叢集的一部分,設於紐約,投資金額至少 5 億美元。

儘管有強大算力投入,特斯拉 AI 事業還是充滿挑戰,去年 12 月兩位負責 Dojo 專案的高階工程師離職,現在特斯拉又不斷裁員節省成本,需更多優秀人才奉獻大腦和肝臟,才有機會讓自駕計程車如期推出,並設法讓 FSD 更上一層樓。

特斯拉 Dojo 次世代電腦將設在紐約,總部德州超級工廠則建造 100MW 規模的資料中心,訓練自駕軟體,硬體採輝達供應方案,基本上都是台積電生產。

目前,只有 Cerebras 和 Tesla 擁有晶圓上系統設計。但台積電確信,隨著時間的推移,更多的人工智慧和高效能運算處理器開發商將建構晶圓級設計。