在近期的小米“人車家全生態大會”上,備受矚目的“天才少女”羅福莉以新身份亮相,并帶來了小米最新發布的AI模型MiMo-V2-Flash。這一模型的推出,標志著小米在人工智能領域邁出了重要一步,也引發了外界對小米AI戰略的廣泛關注。
MiMo-V2-Flash是一款參數規模為309B、激活參數15B的模型。盡管羅福莉本人笑稱其尺寸小到不愿稱之為“大模型”,但這款模型在性能上卻不容小覷。小米團隊將其定位為Agent基座模型,重點優化了高性價比和快速響應能力。據介紹,該模型每秒可生成150個tokens,成本極低,同時在性能上保持了較高水準。
在公開評估榜單上,MiMo-V2-Flash的代碼能力和Agent能力表現突出,已躋身全球開源模型前列。羅福莉透露,該模型在多數評估基準上已超越或與DeepSeek-V3、Kimi K2-Thinking、Qwen等知名模型相當,而參數規模僅為后者的三分之一到二分之一。這一成績引發了行業熱議,有人盛贊其代碼能力領先,也有人質疑其是否為“刷分”之作。
無論外界評價如何,小米對AI的重視已顯而易見。選擇在“人車家全生態大會”上發布新模型,本身就凸顯了AI在小米戰略中的核心地位。小米面臨兩大任務:一是在智能終端領域,通過輕量化模型和端側部署,升級“超級小愛”和澎湃OS,將AI深度融入智能設備;二是在智能駕駛領域,依托大模型提升智駕能力,拓展技術邊界。
小米的AI路線并非盲目跟風。羅福莉指出,當前模型學習方向與生物智能進化存在背離,單純依靠“大力出奇跡”已難以實現更高階的智能突破。因此,小米選擇了一條更符合自身需求的路徑——打造參數小、性能優、成本低的模型。她解釋稱,Scaling Law的邊際效益逐漸遞減,預訓練范式正向后訓練轉變,而穩定的后訓練范式能夠更好地激發強化學習潛力。
基于此,MiMo-V2-Flash的優化邏輯圍繞三個關鍵點展開:強化代碼能力和工具調用以提升智能體交互效率;通過極高推理效率解決信息傳遞瓶頸;通過穩定范式激發強化學習潛能。這些優化使得該模型在代碼能力上尤為突出,甚至在SWE-Bench Multilingual測試中超越了GPT-5等閉源模型。
在成本和速度方面,MiMo-V2-Flash同樣表現亮眼。以Claude Sonnet 4.5為對比,其推理價格僅為前者的2.5%,生成速度卻快一倍。API定價方面,輸入為0.7元/百萬tokens,輸出為2.1元/百萬tokens,在國內模型中極具競爭力。這一優勢得益于小米采用的混合注意力機制技術架構,即5:1的滑動窗口注意力與全局注意力混合結構,既提升了長文和推理能力,又適配現有基礎設施。
然而,309B的參數規模對于端側部署仍是一個挑戰。羅福莉在演講中提出了更具前瞻性的觀點:AI進化的下一階段需要能夠與真實環境交互的物理模型,打造一個具備物理一致性和時空連貫性的虛擬宇宙。這一愿景暗示了小米未來的技術方向——一方面持續優化端側模型,為智能終端賦能;另一方面攻克物理模型,提升智駕能力。
小米的AI戰略已進入快車道。2025年,小米在MiMo系列上動作頻頻:4月開源MiMo-7B系列,5月發布MiMo-VL-7B突破多模態視覺理解,11月推出MiMo-Embodied具身智能大模型整合自動駕駛與機器人技術,12月則以MiMo-V2-Flash壓軸登場。這一系列布局背后是巨額投入——小米集團總裁盧偉冰透露,2025年研發投入預計超300億元,其中四分之一投向AI領域,未來五年計劃投入超2000億元。
組織架構上,小米也在為AI戰略鋪路。2024年起,小米搭建了AI Infra平臺,并著手組建GPU萬卡集群,團隊成立時已擁有6500張GPU資源。人才方面,除了羅福莉負責基礎大模型,小米還引入陳龍加盟智駕團隊,形成“雙核”配置。陳龍團隊提出的跨具身基座模型MiMo-Embodied,試圖解決自動駕駛與機器人間的知識遷移難題,為小米硬件生態提供統一AI驅動邏輯。
雷軍曾強調,小米的AI戰略是“輕量化+本地部署”。憑借全球超10億臺設備的連接優勢,小米正試圖通過AI重塑業務邏輯。MiMo-V2-Flash的發布不僅是技術展示,更是小米向資本市場和用戶傳遞的新信號:這家硬件巨頭正通過高效“大腦”和廣泛“身體”的結合,在智能時代尋求徹底進化。而這一進程的關鍵,在于技術能否真正落地于每一臺小米設備,轉化為用戶可感知的體驗提升。





















