〈台積技術論壇〉廣達:AI有四大面向升級 期待台積電IVR、SoW發展
廣達 (2382-TW) 副總經理趙茂贊今 (14) 日受邀至台積電 (2330-TW)(TSM-US) 技術論壇演講,並於會中表示,AI Scale-up 架構興起,帶動四大面向升級,包括 ASIC 數量、機櫃功耗、晶片 TDP 與 Fabric SerDes 速度,許多挑戰非供應商單方面能解決,尤其在 IVR、SoW 領域仍高度期待台積電的解決方案,支持 AI 持續高速成長。
趙茂贊指出,從廣達角度觀察,AI scale-up 的成長速度可從四個面向來看,包括單一 cluster 內 ASIC 數量在約 10 年間將成長 72 倍、機櫃功耗成長 200 倍、晶片 TDP 成長 10 倍,以及 Fabric SerDes 速度成長 8 倍。這些變化代表 AI 運算需求不只是晶片效能提升,而是整個系統架構、電源、散熱與高速傳輸全面升級。
他表示,近年 AI 興起後,Scale-up 成為關鍵。尤其自 2016 年 AI 專用伺服器問世以來,系統架構快速演進,從早期 8 顆 GPU 互連,逐步擴大至更高密度、更高功耗的 AI cluster。
在電源設計方面,趙茂贊指出,早期 DGX-1 整機耗電約 5kW,但未來數年單一機櫃功耗可能進一步提升至 1MW 等級。當功耗大幅攀升時,電源轉換效率將成為關鍵,即使只有 1% 的效率差異,也會造成顯著能源損耗。
他說,未來 AI 機櫃的電源架構將從過去的 12V、48V,朝 800V DC 等更高電壓發展,再一路轉換至 VCore。從系統角度來看,越靠近 VCore 越有利於效率提升,但同時會受限於面積、散熱與整合難度。廣達雖然也在思考自身 IVR 解決方案,但坦言,若要達到更終極的效率,仍期待台積電能提供更靠近核心的解決方案。
散熱也是另一項關鍵挑戰。趙茂贊表示,隨著晶片 TDP 持續攀升,現有水冷板與晶片之間仍存在多層熱阻。最理想的狀態,是從機櫃到晶片裸晶之間只剩一層熱介面材料,但這已經不是系統廠單方面可以解決的問題,需要晶圓代工、封裝與系統廠共同整合。
高速互連方面,趙茂贊表示,目前 AI 機櫃內大量使用銅線進行互連,但隨著 Fabric SerDes 速度從 56G、112G、224G 持續往 448G 推進,銅線在損耗、重量、線路密度與製造難度上都面臨瓶頸。他指出,若未來 ASIC 數量從數百顆擴大至上千顆甚至上萬顆,現有銅線架構將難以支撐,系統勢必要導入更多光互連,並從機櫃內部設計進一步延伸至跨機櫃、資料中心層級的整體架構。
趙茂贊也提到,更長期來看,若能透過 SoW (system-on-wafer) 或大型交換器整合方案,將多顆晶片整合成超級交換器 (Super Switch),將有機會大幅減少線纜數量並降低系統複雜度。他認為,這類技術未來相當重要,但同樣必須從系統層級出發,而不是單一元件或單一公司各自處理。
趙茂贊指出,台灣半導體與系統供應鏈距離近,是未來推動 AI 系統整合的重要優勢。隨著 AI 晶片功耗持續提升,從封裝、散熱材料、電源模組到系統設計,都必須更早期協同開發,才能讓晶片效能在實際系統中充分發揮。
趙茂贊總結,AI scale-up 帶來 ASIC 數量 72 倍、機櫃功耗 200 倍、晶片 TDP 10 倍與 SerDes 速度 8 倍的成長,凸顯 AI 基礎建設正進入全新階段。未來 AI 系統不再只是伺服器設計問題,也不只是晶片製造問題,而是從晶片、封裝、電源、散熱、互連到整機系統的跨層級整合工程,系統廠與台積電等半導體供應鏈的合作將更加關鍵。