Anthropic指控中國AI公司挖取Claude能力 籲管制晶片出口
據《TechCrunch》報導,Anthropic 指控三家中國 AI 公司利用其 Claude AI 模型建立超過 2.4 萬個假帳號,以提升自家模型能力。
被指控的實驗室包括 DeepSeek、Moonshot AI 與 MiniMax。這些公司據稱透過上述帳號與 Claude 進行超過 1,600 萬次互動,並採用一種稱作「蒸餾 (distillation)」的技術。Anthropic 表示,這些實驗室「鎖定 Claude 最具差異化的能力:代理式推理、工具使用與程式編碼。」
這些指控出現之際,美國正就如何更嚴格執行先進 AI 晶片出口管制展開辯論,相關政策旨在遏制中國的 AI 發展。
蒸餾是 AI 實驗室常用的訓練方法,用於在自家模型上建立更小、更便宜的版本,但競爭對手也可能藉此「複製」其他實驗室的成果。本月稍早,OpenAI 向美國眾議院議員提交備忘錄,指控 DeepSeek 利用蒸餾技術模仿其產品。
DeepSeek 一年前發布開源推理模型 R1 時首次引發關注,該模型以遠低於成本的方式,在效能上幾乎追上美國尖端 AI 實驗室。DeepSeek 預計很快推出最新模型 DeepSeek V4,據報導其在程式編碼方面可超越 Anthropic 的 Claude 與 OpenAI 的 ChatGPT。
各項攻擊規模有所不同。Anthropic 追蹤到 DeepSeek 超過 15 萬次互動,似乎旨在強化基礎邏輯與對齊能力,特別聚焦於對政策敏感查詢提供符合審查要求的安全替代回應。
Moonshot AI 有超過 340 萬次互動,鎖定代理式推理與工具使用、程式編碼與資料分析、電腦操作代理開發以及電腦視覺等領域。該公司上月發布新的開源模型 Kimi K2.5 與一個程式編碼代理。
MiniMax 則進行了 1,300 萬次互動,重點在代理式編碼、工具使用與編排 (orchestration)。Anthropic 表示,在最新 Claude 模型推出時,觀察到 MiniMax 將近一半流量重新導向,以擷取該模型能力。
Anthropic 表示,將持續投資於防禦措施,使蒸餾攻擊更難執行且更易辨識,但同時呼籲「AI 產業、雲端服務供應商與政策制定者協同回應。」
這些蒸餾攻擊出現之際,美國對中國出口 AI 晶片的政策仍存在激烈爭論。上個月,川普政府正式允許輝達在內的美國企業向中國出口先進 AI 晶片。批評者認為,在全球 AI 主導權競賽的關鍵時刻,放寬出口管制恐提升中國的 AI 算力。
Anthropic 表示,DeepSeek、MiniMax 與 Moonshot 進行的能力擷取規模「需要使用先進晶片」。
Anthropic 在部落格中寫道,「因此,蒸餾攻擊進一步強化了出口管制的合理性:限制晶片取得,不僅能限制直接模型訓練,也能降低非法蒸餾的規模。」
Silverado Policy Accelerator 智庫主席、CrowdStrike 共同創辦人 Dmitri Alperovitch 表示,他對這些攻擊並不意外。
他談到,「一段時間以來已很明顯,中國 AI 模型快速進步的部分原因,是透過蒸餾從美國先進模型中『竊取』能力。現在我們可以確定這點。這應該讓我們更有理由拒絕向這些公司出售任何 AI 晶片,否則只會讓它們更具優勢。」
Anthropic 也強調,蒸餾不僅威脅削弱美國在 AI 領域的主導地位,還可能造成國家安全風險。其部落格文章寫道,「Anthropic 及其他美國公司建構的系統,能防止政府與非政府行為者利用 AI,例如開發生物武器或進行惡意網路活動。透過非法蒸餾建立的模型,很可能無法保留這些安全防護,意味著危險能力可能在缺乏多數保護機制的情況下擴散。」
Anthropic 並指出,若威權政府將尖端 AI 用於「攻擊性網路行動、假訊息宣傳與大規模監控」將構成風險。若這些模型被開源,風險更會被放大。