根據《Business Insider》取得的一份輝達 (NVDA-US) 內部文件顯示,美國銀行旗下的金融公司 Capital One 對於其與亞馬遜 (AMZN-US) 雲端服務(AWS)的合作中,AI 成本持續上升感到憂心,並可能正在尋找替代方案。
文件指出,一名輝達員工在內部 email 中提到,輝達曾與 Capital One 討論 AWS 以外的 AI 基礎設施選項,原因在於該銀行「希望控制成本」。
該名輝達員工是在近期一場科技會議上,與 Capital One 代表會面後,於內部信件中回顧並整理相關討論內容。
「他們已經看到自身對 GPU 與推理模型的需求持續成長,而在 AWS 上的成本很快就會失控。」該名輝達員工在信中如此形容 Capital One。
根據這封內部電郵內容,輝達與 Capital One 曾討論所謂的「AI 工廠(AI factory)」與「新型雲端(neo-clouds)」方案。所謂 AI 工廠,指的是企業自行建置的內部資料中心,可用來訓練與執行 AI 模型,作為向第三方租用運算資源的替代選項。依輝達說法,金融機構可利用這類基礎設施,應用於詐欺偵測、客戶服務,以及演算法交易等任務。
所謂「新型雲」是指新興的雲端服務供應商,通常以輝達硬體為核心,專注於 AI 工作負載;相較之下,AWS 則支援更為廣泛的運算需求。
主要的新型雲端業者包括 CoreWeave、Lambda、Crusoe 與 Nebius。輝達近年來與其中多家業者密切合作,部分原因在於希望降低對既有大型雲端巨頭作為客戶的依賴。
Capital One 的情況突顯了 AI 熱潮中的一項關鍵結構性變化:企業一方面競相導入生成式 AI,另一方面也試圖抑制不斷攀升的雲端成本。這項新技術確實潛力龐大,但無論是開發或執行 AI 模型與 AI 應用,所需成本都相當可觀。
大型企業也會定期檢視自身的雲端支出,並評估不同的部署架構,其中愈來愈多採取多家雲端服務商並行的策略。根據 RBC Capital 近期發布的報告,已有 43% 的企業同時使用超過兩家公有雲服務供應商。
Capital One 發言人在聲明中表示:「我們仍然致力於將 AWS 視為最主要的策略性雲端合作夥伴。」輝達則拒絕對此發表評論。
AWS 發言人表示:「我們的定價理念,是持續不懈地降低自身成本結構,並將這些節省下來的成本,以更低價格的形式回饋給 AWS 客戶。降價本身並不難,真正困難的是要有能力承擔降價;而在 AWS,我們為此投入了極大的努力。」
對 AWS 成本感到壓力的並不只有 Capital One。《Business Insider》10 月報導指出,根據亞馬遜於今年 3 月與 7 月的內部文件,AI 新創公司正愈來愈多延後傳統的 AWS 支出,轉而優先投入 AI 模型與開發者工具。
顧問公司 Synergy 的數據也顯示,AWS 的市佔率在 2022 年第二季達到頂峰,此後一直在緩慢下降,而甲骨文和其他新型雲的市佔率則在緩慢增長。但截至今年第三季度,AWS、微軟的 Azure 和 Google 雲端這三大雲端服務供應商仍佔企業雲端設施支出的 63%。
