中國AI正攻破OpenAI的「算力護城河」!DeepSeek和Kimi撼動高成本路線

中國AI正攻破OpenAI的「算力護城河」。(圖:Shutterstock)
中國AI正攻破OpenAI的「算力護城河」。(圖:Shutterstock)

曾盛行於 2025 年前,以 OpenAI 為代表的「閉源+重資本」人工智慧(AI)開發模式,正被兩家中國新興公司的開源低成本路線所撼動。

深度求索(DeepSeek)的 DeepSeek-R1 與月之暗面(Moonshot AI)的 Kimi K2 Thinking 模型,以數百萬美元的低廉成本、開源權重和架構創新,成功在多項關鍵基準測試中追平甚至超越業界巨頭 GPT-5,迫使全球 AI 產業從「砸錢堆料」轉向「高效創新」的新路徑。

長久以來,AI 業界被一種堅不可摧的信念主導:只有透過閉源、巨額投入與無止境的算力堆砌,才能打造出最強大的模型。

OpenAI 作為此模式的旗手,不僅將模型訓練視為最高機密,更與夥伴規劃了高達 1.4 萬億美元的基礎設施藍圖,被視為確保領先地位的唯一途徑。

據報導,僅訓練 GPT-4 的成本就耗費約 1 億美元。這種「用錢砸出智慧」的邏輯,一度為 OpenAI 帶來天價估值與洶湧資本。

然而,隨著 DeepSeek-R1 和 Kimi K2 Thinking 的橫空出世,這場「燒錢競賽」的合理性正受到嚴峻挑戰。

DeepSeek-R1 橫空出世:低成本高性能引發市場震盪

今年年初,名不見經傳的深度求索公司發佈了 DeepSeek-R1。這款模型不僅開源,更號稱性能可與 OpenAI 頂級模型比肩。

更令人震驚的是,DeepSeek 宣稱其訓練成本僅約 560 萬美元,相較於 Meta 開發 Llama 模型的成本,僅為其約十分之一。

DeepSeek 以微薄成本實現高性能,直接質疑了開發 AI 必須投入天量資金和算力的傳統觀念。

DeepSeek-R1 發布後,其 App 下載量在短短一週內迅速攀升,一度超越 ChatGPT,登上美國蘋果 App Store 免費榜首。

這一事件在華爾街引發劇烈反應,微軟和 Google 股價應聲下挫,而 AI 晶片巨頭輝達的市值更在短時間內蒸發約 6000 億美元。

資本市場用腳投票,開始重新審視 AI 賽道的投入產出模型。

Kimi K2 Thinking 震撼登場:開源模型性能超越 GPT-5

當 DeepSeek 掀起的波瀾尚未平息,另一家中國新創公司月之暗面又在年末投下了一枚「核彈」:Kimi K2 Thinking(K2 Thinking)。

這款最新開源巨模型在上週發佈,竟以開源身份在多個關鍵基準上追平甚至超越了 OpenAI 的旗艦模型 GPT-5。

據傳,K2 Thinking 的算力成本約為 460 萬美元。但在高難度測試上,它卻展現出令人難以置信的性能:

  • 在綜合程式設計挑戰 SWE-Bench Verified 上,K2 Thinking 以 71.3% 的通過率略勝 GPT-5。
  • 在複雜網頁搜索推理任務 BrowseComp 上,K2 Thinking 以 60.2% 對 54.9% 的得分大幅領先 GPT-5。

這些亮眼數字標誌著一個歷史性轉折:開源模型與頂級閉源模型之間的性能鴻溝已實質性塌陷。

K2 Thinking 的成功並非偶然,而是技術路線差異帶來的成本逆襲。

該模型採用了混合專家架構(MoE),將龐大模型劃分為 384 個專家模組,每次推理僅調用其中不到 3.5%(約 8 個專家)的智力,卻能享受近似兆參數的知識儲備,進而實現「大而不笨重」的推理效率,成本效率提升達百倍之多。

更關鍵的是,月之暗面研發了 MuonClip 自定義優化器,成功避免了超大模型訓練中常見的梯度爆炸問題,使 Kimi-K2 在長達 15.5 兆 token 的訓練中實現了「零訓練崩潰」。

這些技術創新,等於是用聰明才智破解了過去只有透過巨額資金和算力才能解決的難題。

當技術壁壘被攻克,開源路線在經濟層面的優勢便愈發凸顯。K2 Thinking 的模型權重可自由下載部署,且其 API 價格極具競爭力。

  • K2 Thinking 官方 API 定價: 每百萬輸入 Token 約 4 元人民幣,輸出 Token 約 16 元人民幣
  • OpenAI GPT-5 API 定價: 每百萬輸入 Token 約 9 元人民幣,輸出 Token 約 71 元人民幣

換算下來,同樣百萬 Token 的處理費用,K2 Thinking 僅為 GPT-5 的十分之一不到。

對於企業和開發者而言,其可本地部署的靈活性與低廉的 API 價格,無疑極具誘惑力。

市場正迅速響應,越來越多的 AI 工具和平台開始整合 K2 Thinking,而 OpenAI 先前許下的天價數據中心投資承諾,正面臨市場的嚴峻考驗與質疑。

DeepSeek 和 Kimi K2 Thinking 帶來的,不僅是對舊路線的追趕,更像是一場徹底的證偽。

AI 行業的敘事正在改寫:與其痴迷於砸錢堆出更大模型,不如將精力投入於架構創新和工程穩定性,以換取成本效率和開放生態。

這場變革正促使狂熱的 AI 估值泡沫冷卻,投資者開始關注實際效能和商業可行性。


延伸閱讀

相關貼文

prev icon
next icon