小米MiMo-V2-Fla「降維打擊」 成本僅業界零頭、性能直逼GPT-5
小米正以極致的性價比和卓越的性能,對全球 AI 市場發起一次深刻的「降維打擊」。其最新一代開源 AI 模型 MiMo-V2-Flash,在性能上直逼頂級閉源模型,但其運營成本卻僅為業界的零頭。
MiMo-V2-Flash 以每百萬輸入 Token 僅 0.1 美元的超低成本和每秒 150 個 Token 的驚人推理速度,衝擊著 OpenAI、DeepSeek 等頂尖玩家的護城河,重新定義了高性能開源模型的標準。
MiMo-V2-Flash 的發布,意味著效能、成本和速度之間「不可能三角」的打破。其核心技術在於採用總參數高達 3090 億的混合專家(MoE)架構,但實際運行僅啟動約 150 億參數,顯著降低了運算資源消耗。
同時,它創新性地採用了混合滑動視窗注意力機制,有效將 KV 快取儲存需求降低近 6 倍,並支援高達 256k 的超長上下文視窗,使其能高效處理數十頁技術文件或中篇小說,性能毫不妥協。
更進一步,透過輕量級多 Token 預測(MTP)模組的原生整合,模型推理速度直接提升 2 到 2.6 倍,實現了效率的「一箭雙雕」。
在實際性能對標中,MiMo-V2-Flash 的表現足以讓業界震驚。在通用推理基準測試中,它與月之暗面的 Kimi K2 Thinking 和 DeepSeek V3.2 Thinking 不相上下,尤其在長上下文評估中甚至實現了超越。
更引人注目的是,在複雜的 Agent 任務 SWE-Bench Verified 中,MiMo-V2-Flash 以 73.4% 的高分超越所有開源競爭對手,並展現出逼近 OpenAI 頂級模型 GPT-5-High 的驚人實力。在程式設計能力方面,其表現與被視為行業最佳編碼模型的 Anthropic Claude 4.5 Sonnet 旗鼓相當,而運營成本卻僅是後者的一個零頭,凸顯了無與倫比的成本效益優勢。
小米此次將 MiMo-V2-Flash 全面開源,並將其權重和推理程式碼發佈到 Hugging Face 等平台,是其宏大 AGI(通用人工智慧)路線圖上的關鍵一步。
小米 MiMo 團隊負責人,前 DeepSeek 核心研究員羅福莉(Luo Fu Li)明確指出,MiMo-V2-Flash 是其 AGI 路線圖上的「第二步」。這不僅預示著小米有清晰且野心勃勃的長期規劃,更展現了其對 AI 人才和 AGI 方向的重磅押注。
摩根士丹利分析師指出,這款高性能模型將作為基石,深刻重塑小米「人、車、家」的全生態系統,為智慧型手機、IoT 設備乃至電動車提供獨特的智慧體驗,築起堅固的生態護城河。
MiMo-V2-Flash 的問世,宣告著屬於開源模型的高性能、低成本「小米時刻」已經到來,為全球 AI 開發者提供了前所未有的工具和機會。