五月草白白色视频在线观看,日韩欧美国产亚洲在线

小米AI新突破：羅福莉領(lǐng)銜打造萬億參數(shù)模型，獲林俊旸力贊

發(fā)布時(shí)間：2026-03-20 18:43 來源：快訊作者：李娜

全球最大API聚合平臺OpenRouter上，一款名為Hunter Alpha的神秘模型在3月11日悄然上線。這款未標(biāo)注開發(fā)者身份的模型以“隱身模式”發(fā)布，并免費(fèi)向開發(fā)者開放訪問權(quán)限。測試數(shù)據(jù)顯示，其參數(shù)規(guī)模達(dá)1萬億，上下文窗口支持100萬token，且自稱是主要基于中文訓(xùn)練的中國AI模型，知識截止時(shí)間為2025年5月。由于這些特性與DeepSeek此前發(fā)布的模型風(fēng)格高度相似，市場一度猜測這是DeepSeek在秘密測試下一代系統(tǒng)。

短短七天內(nèi)，Hunter Alpha的累計(jì)調(diào)用量突破1萬億token，連續(xù)多日占據(jù)平臺榜單首位。然而，這一“黑馬”的真實(shí)身份很快被揭曉——小米MiMo團(tuán)隊(duì)正式認(rèn)領(lǐng)該模型，并確認(rèn)其為旗艦?zāi)Ｐ蚆iMo-V2-Pro的內(nèi)部測試版本。這一消息引發(fā)行業(yè)關(guān)注，因?yàn)樾∶状饲霸贏I領(lǐng)域并未展現(xiàn)出如此激進(jìn)的布局。更引人注目的是，小米AI團(tuán)隊(duì)的核心人物是前DeepSeek核心研究員羅福莉，她的技術(shù)背景為這一成果增添了更多解讀空間。

在近期的小米新品發(fā)布會上，雷軍正式推出了三款自研大模型：旗艦基座模型MiMo-V2-Pro、全模態(tài)理解模型MiMo-V2-Omni以及擬人語音大模型MiMo-V2-TTS。其中，MiMo-V2-Pro作為核心產(chǎn)品，總參數(shù)量達(dá)1萬億，但通過稀疏化設(shè)計(jì)將激活參數(shù)控制在42B，支持1M超長上下文窗口。這一架構(gòu)基于改進(jìn)的MoE（Mixture-of-Experts）體系，通過動(dòng)態(tài)激活部分子網(wǎng)絡(luò)，在保持計(jì)算效率的同時(shí)擴(kuò)展了模型容量。其注意力機(jī)制采用分層組合的混合設(shè)計(jì)，結(jié)合局部窗口注意力與全局注意力，有效解決了長上下文場景下的推理退化問題。

從應(yīng)用場景來看，MiMo-V2-Pro的定位突破了傳統(tǒng)語言模型的邊界。它不再以生成對話為核心目標(biāo)，而是作為智能體系統(tǒng)的中樞，能夠理解任務(wù)目標(biāo)、規(guī)劃執(zhí)行路徑、調(diào)用外部工具，并在多階段過程中持續(xù)修正策略。例如，在代碼生成和自動(dòng)化任務(wù)中，模型可在單次上下文中保留完整的中間狀態(tài)、工具調(diào)用結(jié)果和歷史決策路徑，避免頻繁的上下文重建。這一特性使其在匿名測試階段就展現(xiàn)出顯著優(yōu)勢，OpenRouter數(shù)據(jù)顯示，其使用場景高度集中在開發(fā)工具和復(fù)雜任務(wù)執(zhí)行領(lǐng)域。

性能評估方面，MiMo-V2-Pro在通用Agent能力測試（Claweval）中得分61.5，接近Claude Opus 4.6的水平；在PinchBench測試中躋身全球前三，編碼能力甚至超越Claude Sonnet 4.6。更引人注目的是其定價(jià)策略：在256K上下文長度內(nèi)，輸入token單價(jià)為每百萬1美元，輸出為每百萬3美元；擴(kuò)展至100萬上下文時(shí)，輸入單價(jià)僅升至每百萬2美元，輸出為每百萬6美元，約為Claude Opus 4.6成本的五分之一。這一價(jià)格優(yōu)勢使其在商業(yè)應(yīng)用中具備顯著競爭力。

羅福莉的技術(shù)路線選擇成為關(guān)注焦點(diǎn)。這位畢業(yè)于北京大學(xué)計(jì)算語言學(xué)研究所的研發(fā)者，曾在阿里達(dá)摩院主導(dǎo)多語言預(yù)訓(xùn)練模型VECO的開發(fā)，并在DeepSeek期間參與MoE大模型DeepSeek-V2的核心設(shè)計(jì)。2025年11月加入小米后，她迅速組建團(tuán)隊(duì)并推進(jìn)1T基礎(chǔ)模型的訓(xùn)練。據(jù)其透露，模型最初的目標(biāo)是提升長上下文推理效率，而混合注意力機(jī)制的創(chuàng)新設(shè)計(jì)使其成為智能體時(shí)代的理想基礎(chǔ)。她還在社交平臺分享了團(tuán)隊(duì)管理細(xì)節(jié)，例如要求成員每天與AI對話不少于100次，并表示將在模型穩(wěn)定后考慮開源。

小米的AI布局并非臨時(shí)起意。雷軍在發(fā)布會上透露，公司2025年的研發(fā)和資本投入將超過160億元，其中AI是重點(diǎn)方向。盡管此前在AI領(lǐng)域保持低調(diào)，但MiMo-V2-Pro的發(fā)布標(biāo)志著小米正式加入大模型競爭行列。在全球大模型綜合智能排行榜Artificial Analysis上，該模型已位列全球第八，按品牌排名則位居第五，超越了xAI Grok等競爭對手。雷軍承認(rèn)，小米的實(shí)際進(jìn)展可能比外界看到的更快，而持續(xù)投入將是其在AI時(shí)代保持競爭力的關(guān)鍵。

更多>同類內(nèi)容