不想太依賴!馬斯克自曝用於FSD超級電腦Dojo 持續研發D2晶片挑戰輝達

馬斯克自曝用於FSD超級電腦Dojo 持續研發D2晶片(圖:Shutterstock)
馬斯克自曝用於FSD超級電腦Dojo 持續研發D2晶片(圖:Shutterstock)

特斯拉 (TSLA-US) 執行長馬斯克近來表示,為配合即將在 10 月揭曉的 Robotaxi 計畫,該公司將對超級電腦 Dojo「加倍投入」。儘管專為訓練全自動駕駛 (FSD) 的 Dojo 未來仍充滿挑戰,但它的成功將大幅推動特斯拉在自駕跟 AI 領域的進步。

xAI 耗時 19 天打造由 10 萬顆輝達 (NVDA-US) H100 晶片集群來訓練 Grok-3,而在訓練 FSD、Optimus 機器人方面,馬斯克同樣不惜重金,投入大量的運算資源。

摩根士丹利去年 9 月曾出具研究報告預測,Dojo 可透過 Robotaxi 和軟體服務等形式釋放新的收入來源,為特斯拉的市值增加 5000 億美元。

馬斯克周日 (4 日) 在前往德州超級工廠參觀特斯拉超級電腦集群後表示,這將是一個擁有約 10 萬個 H100/H200 GPU 晶片,並配備大規模記憶體的系統,用於 FSD 和 Optimus 機器人的影片訓練。

不僅如此,除了輝達 GPU,這個超級電腦集群還配備特斯拉 HW4、AI5、Dojo 系統。它們將由一個高達 500 兆瓦的大型系統提供電力和冷卻。

上月中旬左右,有網友稱今年底特斯拉將擁有 AI 訓練算力,等價於 9 萬塊 H100 的性能。馬斯克當時回應稱,到今年底,Dojo 1 將擁有大約 8000 個相當於 H100 算力。規模不算大,但也不算小。

事實上,馬斯克去年 6 月曾透露 Dojo 已經上線並運作幾個月,此話也暗示 Dojo 已投入到一些任務的訓練中。

特斯拉之所以需要 Dojo,是因為特斯拉電動車採取的是「全視覺」路徑,僅依靠相機捕捉視覺數據,輔以高清地圖進行定位,再使用神經網路處理數據以進行自動駕駛的快速決策。

曾在特斯拉擔任 AI 負責人的 Andrej Karpathy 表示,實現 FSD 基本是在「從頭開始構建一種人造動物」。

幸運的是,特斯拉幾乎不太需要擔心數據不夠的問題。目前約有 180 萬人為 FSD 訂閱用戶,這意味著特斯拉能收集到數百萬英里的駕駛影像用於訓練。

然而,一些產業專家表示,將更多數據輸入模型並期望其變得更加智慧的蠻力方法恐有侷限性。

普渡大學矽谷電氣與計算機工程教授 Anand Raghunathan 指出,首先,存在經濟約束且很快這樣做的成本會變得太高。此外,更多數據不一定意味著更多的資訊,因此取決於這些數據是否包含可用於創建更好模型的資訊,以及訓練過程是否能夠真正將這些資訊提煉成更好的模型。

但 Raghunathan 說,儘管有這些疑慮存在,但至少在短期內,數據增加的趨勢似乎會持續下去。數據量增加意味著需要更多的計算能力來儲存和處理所有數據,以訓練特斯拉的 AI 模型。 這就是為何需要 Dojo 的原因。

目前,特斯拉似乎依賴輝達為 Dojo 訓練提供動力,但它不想孤注一擲,尤其因為輝達晶片價格昂貴。特斯拉還希望製造出更好的產品,以增加頻寬並減少延遲。這也是為什麼這家汽車製造商的 AI 部門決定推出自己的客製硬體程式,旨在比傳統系統更有效地訓練 AI 模型。

在硬體與軟體協同這方面,特斯拉與蘋果的觀點類似,即應該實現兩者的高度協同,尤其是 FSD 這種高度專門化的系統,更應該擺脫高度標準化的 GPU,使用客製化硬體。這一願景的核心是特斯拉專有的 D1 晶片,於 2021 年發佈,今年 5 月開始由台積電量產。

特斯拉還在研發下一代 D2 晶片,旨在解決資訊流瓶頸問題。D2 不會將各個晶片連接起來,而是將整個 Dojo 晶片放在一塊矽片上。

控制自己的晶片生產意味著特斯拉未來能以低成本為 AI 訓練程式快速增加大量算力,尤其是在特斯拉和台積電擴大晶片生產規模的情況下。這也代表特斯拉未來可能不需要依賴輝達的晶片,因為輝達的晶片價格越來越高,而且難以保證安全。


相關貼文

prev icon
next icon