傳字節跳動擬用華為晶片 訓練新的AI模型

傳字節跳動擬用華為晶片 訓練新的AI模型(圖:REUTERS/TPG)
傳字節跳動擬用華為晶片 訓練新的AI模型(圖:REUTERS/TPG)

路透周一 (30 日) 援引知情人士消息報導,TikTok 中國母公司字節跳動計劃以華為晶片為主力,訓練並開發新的人工智慧 (AI) 模型。由於美國的限制措施,這家社群媒體巨擘不得不回國尋找晶片,加速發展自有的 AI 技術。

知情人士透露,字節跳動在 AI 競賽中的下一步是使用華為的昇騰 910B(Ascend 910B) 晶片來訓練一個大型語言模型 (LLM)。不只如此,該公司還打算推出一款新的 AI 模型,不過並未透露是否會使用華為的晶片。

據悉,字節跳動已將昇騰 910B 用於運算強度較低的推理任務,這些任務涉及預先訓練 AI 模型進行預測。

報導指出,訓練 AI 模型對晶片的需求非常高,而且還需要大量數據,因此需要用到超高性能的晶片,例如輝達 (NVDA-US) 的高階圖形處理器 (GPU)。

其中一名知情人士說,以計算參數衡量,新模型的能力和複雜程度可能不如字節跳動現有的 AI 模型「豆包」(Doubao) 強大。

對於上述報導,字節跳動發言人 Michael Hughes 說:「整個假設都是錯誤,目前還沒有開發新的模型。」華為則並未回覆置評請求。

據了解,字節跳動今年已訂購逾 10 萬片昇騰 910B 晶片,但截至 7 月只收到不到 3 萬片,生產速度太慢無法滿足公司需求。與輝達在中國供應的晶片相比,昇騰 910B 供應受限、運算能力有限,讓字節跳動無法設定時間推出新模型。

知情人士還透露,對 AI 的日益重視讓字節跳動成為華為 AI 晶片的大型買家之一。與此同時,中國也是輝達為應對貿易限製而為中國市場量身定制的 H20 人工智慧晶片的最大買家,這家 TikTok 的母公司還是微軟 (MSFT-US) 在亞洲透過雲端運算存取輝達晶片的最大客戶。

對上述消息,輝達拒絕置評、微軟則沒有回覆置評請求。


延伸閱讀

相關貼文

prev icon
next icon