不只賣GPU!輝達AI版圖再擴張 Vera CPU正式交付四大客戶
輝達 (NVDA-US) 宣布,旗下首款專為代理式 AI(Agentic AI) 設計的 Vera CPU 已完成首批交付,客戶包括 Anthropic、OpenAI、SpaceX AI 以及甲骨文 (ORCL-US) 雲端基礎設施 (OCI)。這也意味著輝達執行長黃仁勳先前所稱的「下一個數十億美元級業務」,已從產品展示階段進入實際商業部署。
根據輝達公布資訊,負責超大規模運算與高效能運算業務的副總裁 Ian Buck 親自將首批 Vera 系統送往各家公司。首站為 Anthropic 位於舊金山的辦公室,其後交付至 OpenAI、SpaceX AI 及 OCI。
市場分析認為,Vera 的重要性不在於推出另一款 CPU,而是代表 AI 產業需求正從單純模型訓練,進一步轉向能執行複雜任務的代理式 AI 架構。與傳統生成式 AI 主要負責回答問題、生成內容不同,代理式 AI 需要自主規劃流程、呼叫外部工具、執行程式碼、搜尋資料並完成多步驟工作,因此對 CPU 運算、記憶體管理及資料調度能力提出更高要求。
輝達表示,Vera 是首款完全由公司自行設計的 CPU,搭載 88 個自研 Olympus 核心,記憶體頻寬達 1.2TB/s,單核心效能較傳統 CPU 提升 50%,整體效率則提高至兩倍。Vera 主要作為 AI 系統中的主機 CPU,負責資料搬移、記憶體管理與系統控制,使 GPU 可維持高速運作。
Vera 的設計也反映 AI 基礎建設架構正在改變。過去市場焦點集中於 GPU 運算能力,但在代理式 AI 時代,CPU 重新成為關鍵元件。輝達指出,長上下文推理、工具呼叫、強化學習沙盒以及多層代理流程,大量工作實際上發生在 CPU 層。
在首批客戶中,甲骨文態度尤其積極。OCI 資深副總裁 Karan Batta 表示,OCI 預計自 2026 年起部署數十萬顆 Vera CPU,以支援企業級 AI 工作負載。OCI 指出,代理式 AI 需要長時間高負載推理能力,而 Vera 在效率、密度及空間利用率方面符合需求。
分析人士指出,甲骨文的大規模採購承諾顯示市場需求已不只是技術展示,而是開始轉化為實際訂單與資本支出。尤其目前超大型雲端業者正加速擴建 AI 資料中心,市場對 AI 基礎設施的投資規模持續攀升。部分產業研究預估,美國五大雲端與 AI 基礎設施業者 2026 年資本支出可能接近 7,000 億美元。
值得注意的是,Vera 並非單獨運作產品,而是輝達新一代 AI 工廠架構的重要一環。未來 Vera 將與 Rubin GPU、BlueField 4 DPU、Spectrum-X 乙太網路平台以及 MGX 機架系統共同構成完整架構。
在 Vera Rubin NVL72 系統中,Vera 可透過第二代 NVLink-C2C 直接連接 Rubin GPU,形成統一記憶體架構,大幅提升資料供應效率與整體運算能力。
此外,先前公布的合作名單顯示,除甲骨文外,包括 Meta Platforms (META-US)、阿里巴巴 (BABA-US)、CoreWeave(CRWV-US) 及其他大型雲端業者也正規劃導入 Vera 平台。製造夥伴則涵蓋戴爾科技 (DELL-US)、慧與科技 (HPE-US)、聯想、美超微 (SMCI-US)、鴻海、廣達、和碩及緯創等供應鏈廠商。
市場觀察人士認為,Vera 正式進入商業部署,代表輝達 AI 戰略已從 GPU 進一步擴展至 CPU、網路與機架系統層級。隨著 AI 資料中心建設熱潮延續,輝達在生成式 AI 與代理式 AI 基礎設施市場的主導地位,可能進一步鞏固。