小米近日正式發布並開源了MiMo-V2.5與MiMo-V2.5-Pro兩款模型,採用MIT許可證,為開發者提供了一個潛在的低成本選擇,用於構建能夠執行編程、工作流自動化等長時任務的AI智能體。
兩款模型均支持100萬Token的上下文窗口。其中,MiMo-V2.5-Pro專為複雜智能體任務和編程場景設計,而MiMo-V2.5則是一款原生全模態模型,支持文本、圖像、影片和音頻輸入。
此次發布恰逢智能體AI工作負載對企業AI預算帶來新壓力之際。這類系統在規劃任務、調用工具、編寫代碼及處理錯誤的過程中會消耗大量Token,使得成本管控和部署靈活性對開發者而言愈發重要。
小米表示,通過採用MIT許可證,企業可以自由對模型進行商業部署、持續訓練和微調,無需額外授權。Kadence International高級副總裁圖利卡·希爾(Tulika Sheel)認為,MIT許可證使該模型頗具吸引力。她表示:"該許可允許企業自由修改、部署和商業化模型,不受任何限制,這在當前AI領域實屬罕見。"
在ClawEval測試基準上,小米在部落格中指出:"MiMo-V2.5-Pro的Pass?得分達到64%,每條軌跡僅消耗約7萬個Token,與Claude Opus 4.6、Gemini 3.1 Pro及GPT-5.4在同等能力水平下相比,Token消耗減少約40%至60%。"
兩款模型均採用稀疏混合專家(MoE)架構以控制計算成本。擁有3100億參數的MiMo-V2.5每次請求僅激活150億個參數,而擁有1.02萬億參數的Pro版本每次激活420億個參數。小米表示,Pro版本的混合注意力設計在處理長上下文任務時,可將KV緩儲存存需求降低近7倍。
小米還列舉了多項長任務測試案例,包括MiMo-V2.5-Pro在4.3小時內通過672次工具調用完成了一個Rust語言編寫的SysY編譯器,全部233個隱藏測試用例均通過。此外,該模型還在11.5小時的自主運行中,經過1868次工具調用,生成了一個包含8192行代碼的桌面影片編輯器。
小米MiMo-V2.5系列模型能否在智能體編程和自動化工作負載領域贏得企業開發者的青睞,最終將取決於企業在性能、成本與風險之間的綜合評估。
Omdia首席分析師連傑蘇(Lian Jye Su)表示:"企業開發者在評估小米MiMo-V2.5及其衍生版本時,應著重考量總擁有成本(TCO),包括Token效率、每次成功任務的成本,以及相較於專有模型所節省的授權費用。閉源前沿模型在通用任務和極端邊緣案例上可能仍占優勢,但開源權重模型在高並發量的智能體工作場景中表現更為出色。"
Pareekh Consulting首席執行官帕里克·賈因(Pareekh Jain)建議,企業不應將MiMo-V2.5視為Claude或GPT的替代品,而應將其定位為適用於高Token消耗工作負載的高性價比智能體模型。
"關鍵的基準信號不只是準確率,而是每次成功任務所消耗的Token數量,"賈因說道,"前沿模型在複雜編程基準測試中往往能獲得更高的成功率,但代價是巨大的推理開銷。MiMo-V2.5的設計核心是Token效率,即以明顯更少的輸入輸出Token實現可比的結果。"
賈因認為,這使得類MiMo模型可以成為重複性編程、質量保證、遷移、文檔整理、測試及自動化工作負載的"經濟型主力",而閉源前沿模型則繼續在最高難度任務中保持質量上限。
Gartner高級首席分析師阿希什·班納吉(Ashish Banerjee)表示,MiMo這類模型有望從根本上改變企業長任務智能體的AI經濟模式。
"當任務延伸至數百萬Token時,按量計費的專有API看起來不再是一種便利,而更像是對疊代的一種'稅收',"班納吉說,"相比之下,MiMo的MIT許可證、開放權重、100萬Token上下文窗口以及相對低廉的定價,使私有雲或自託管部署在戰略上具有相當的可信度。"
不過,班納吉也指出,這並不意味著企業會完全放棄專有API。
"企業將繼續使用專有API來追求前沿精度和低運營消耗,同時將規模化、可重複的智能體工作流轉向開源模型,因為在這些場景下,成本可預測性、數據控制權和定製化能力更為重要,"班納吉表示,"簡而言之,長任務、高並發的智能體AI將演變為混合市場格局,MiMo等開源模型將打破對純API的依賴。"
連傑蘇也補充指出,由於源自中國的模型可能在西方受監管組織中引發合規顧慮,該模型的市場推廣或將面臨一定挑戰。
Q&A
Q1:MiMo-V2.5與MiMo-V2.5-Pro有什麼區別?
A:MiMo-V2.5是一款原生全模態模型,支持文本、圖像、影片和音頻多種輸入形式;而MiMo-V2.5-Pro則專為複雜智能體任務和編程場景設計,擁有1.02萬億參數,每次請求激活420億參數,並具備混合注意力設計,可將KV緩儲存存需求降低近7倍,更適合處理長上下文的高難度任務。
Q2:MiMo-V2.5的Token效率相比其他主流模型有多大優勢?
A:根據小米官方數據,在ClawEval基準測試中,MiMo-V2.5-Pro的Pass?得分達到64%,每條軌跡僅消耗約7萬個Token,與Claude Opus 4.6、Gemini 3.1 Pro及GPT-5.4在同等能力水平下相比,Token消耗減少約40%至60%。這意味著在高並發、長任務的智能體工作場景中,使用MiMo可以顯著降低運行成本。
Q3:企業採用MiMo-V2.5模型時需要注意哪些風險?
A:分析師指出,企業在評估MiMo-V2.5時應綜合考量總擁有成本,包括Token效率和每次成功任務的成本。此外,閉源前沿模型在通用任務和極端邊緣場景中仍具優勢。值得注意的是,MiMo作為中國來源的模型,在西方受監管行業或組織中可能面臨合規審查和採購顧慮,企業需結合自身的數據合規要求審慎評估。






