輝達 (NVDA-US) 在 AI 晶片市場的壟斷地位正面臨前所未有的挑戰,因超微 (AMD-US) 、亞馬遜 (AMZN-US) 等科技巨頭及 SambaNova Systems、Groq 等新創公司紛紛瞄準大模型推理能力,推出各類客製晶片,在可靠性和成本端不斷進步。
根據市調機構 Omdia 預估,2024 年數據中心在非輝達晶片陣營上的支出將成長 49%,達到 1260 億美元,晶片領域的競爭正在進入一個更加多元化的競爭新階段。
這些新玩家不僅帶來更具性價比的選擇,更贏得了重要客戶的認可,例如 Meta(META-US) 已開始使用超微 MI300 晶片支援其新 AI 模型 Llama 3.1 405B 的推理計算,亞馬遜的 Trainium 2 晶片也得到包括蘋果在內的潛在使用者好評。
「推理」階段正成為競爭對手突破輝達壟斷 AI 晶片領域的關鍵。
高通 (QCOM-US) 執行長 Cristiano Amon 說,「真正的商業價值來自於推理,而推理正在開始規模化」,並稱高通打算使用亞馬遜的新晶片執行 AI 任務。
在成本方面,輝達現有晶片售價高達 1.5 萬美元,新款 Blackwell 晶片預計將達到數萬美元。相比之下,輝達的競爭對手提供了更具性價比的選擇。
德州高級計算中心執行主任 Dan Stanzione 表示,由於功耗和價格優勢,該中心打算在使用輝達 Blackwell 超級計算機的同時,採用 SambaNova 的晶片進行推理任務,因為其功耗和價格較低。
亞馬遜在 AI 晶片領域表現出強烈的進取心,今年投入 750 億美元用於 AI 晶片等硬體,新款 Trainium 2 晶片性能是前代產品的 4 倍,並已宣佈更強大的 Trainium 3 晶片計畫。
AI 新創公司 Poolside 技術長 Eiso Kant 估計,相較於輝達,Trainium 2 在每美元計算性能上提升 40%。更重要的是,亞馬遜計劃在全球數據中心提供基於 Trainium 的服務,這對推理任務尤為重要。
值得注意的是,亞馬遜還與 AI 新創公司 Anthropic 達成合作,將建造一個包含數十萬枚新 Trainium 晶片的巨型 AI 工廠,計算能力將是 Anthropic 此前使用過的任何系統的 5 倍。
儘管如此,競爭加劇並不代表輝達短期就會失去領先地位。
此前,輝達執行長黃仁勳在史丹佛大學演說時仍強調,該公司在 AI 軟體和推理能力上具有重大優勢,新款 Blackwell 晶片需求依然強勁。「我們產品的總擁有成本非常划算,即便競爭對手晶片是免費的,也不夠便宜。」