小米MiMo-V2-Fla「降維打擊」成本僅業界零頭、性能直逼GPT-5

鉅亨網新聞中心2025年12月18號18點0分

小米正以極致的性價比和卓越的性能，對全球 AI 市場發起一次深刻的「降維打擊」。其最新一代開源 AI 模型 MiMo-V2-Flash，在性能上直逼頂級閉源模型，但其運營成本卻僅為業界的零頭。

MiMo-V2-Flash 以每百萬輸入 Token 僅 0.1 美元的超低成本和每秒 150 個 Token 的驚人推理速度，衝擊著 OpenAI、DeepSeek 等頂尖玩家的護城河，重新定義了高性能開源模型的標準。

MiMo-V2-Flash 的發布，意味著效能、成本和速度之間「不可能三角」的打破。其核心技術在於採用總參數高達 3090 億的混合專家（MoE）架構，但實際運行僅啟動約 150 億參數，顯著降低了運算資源消耗。

同時，它創新性地採用了混合滑動視窗注意力機制，有效將 KV 快取儲存需求降低近 6 倍，並支援高達 256k 的超長上下文視窗，使其能高效處理數十頁技術文件或中篇小說，性能毫不妥協。

更進一步，透過輕量級多 Token 預測（MTP）模組的原生整合，模型推理速度直接提升 2 到 2.6 倍，實現了效率的「一箭雙雕」。

在實際性能對標中，MiMo-V2-Flash 的表現足以讓業界震驚。在通用推理基準測試中，它與月之暗面的 Kimi K2 Thinking 和 DeepSeek V3.2 Thinking 不相上下，尤其在長上下文評估中甚至實現了超越。

更引人注目的是，在複雜的 Agent 任務 SWE-Bench Verified 中，MiMo-V2-Flash 以 73.4% 的高分超越所有開源競爭對手，並展現出逼近 OpenAI 頂級模型 GPT-5-High 的驚人實力。在程式設計能力方面，其表現與被視為行業最佳編碼模型的 Anthropic Claude 4.5 Sonnet 旗鼓相當，而運營成本卻僅是後者的一個零頭，凸顯了無與倫比的成本效益優勢。

小米此次將 MiMo-V2-Flash 全面開源，並將其權重和推理程式碼發佈到 Hugging Face 等平台，是其宏大 AGI（通用人工智慧）路線圖上的關鍵一步。

小米 MiMo 團隊負責人，前 DeepSeek 核心研究員羅福莉（Luo Fu Li）明確指出，MiMo-V2-Flash 是其 AGI 路線圖上的「第二步」。這不僅預示著小米有清晰且野心勃勃的長期規劃，更展現了其對 AI 人才和 AGI 方向的重磅押注。

摩根士丹利分析師指出，這款高性能模型將作為基石，深刻重塑小米「人、車、家」的全生態系統，為智慧型手機、IoT 設備乃至電動車提供獨特的智慧體驗，築起堅固的生態護城河。

MiMo-V2-Flash 的問世，宣告著屬於開源模型的高性能、低成本「小米時刻」已經到來，為全球 AI 開發者提供了前所未有的工具和機會。

小米MiMo-V2-Fla「降維打擊」 成本僅業界零頭、性能直逼GPT-5

小米MiMo-V2-Fla「降維打擊」成本僅業界零頭、性能直逼GPT-5