在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

小米AI新突破:羅福莉領(lǐng)銜打造萬億參數(shù)模型,獲林俊旸力贊

   發(fā)布時(shí)間:2026-03-20 18:43 作者:李娜

全球最大API聚合平臺OpenRouter上,一款名為Hunter Alpha的神秘模型在3月11日悄然上線。這款未標(biāo)注開發(fā)者身份的模型以“隱身模式”發(fā)布,并免費(fèi)向開發(fā)者開放訪問權(quán)限。測試數(shù)據(jù)顯示,其參數(shù)規(guī)模達(dá)1萬億,上下文窗口支持100萬token,且自稱是主要基于中文訓(xùn)練的中國AI模型,知識截止時(shí)間為2025年5月。由于這些特性與DeepSeek此前發(fā)布的模型風(fēng)格高度相似,市場一度猜測這是DeepSeek在秘密測試下一代系統(tǒng)。

短短七天內(nèi),Hunter Alpha的累計(jì)調(diào)用量突破1萬億token,連續(xù)多日占據(jù)平臺榜單首位。然而,這一“黑馬”的真實(shí)身份很快被揭曉——小米MiMo團(tuán)隊(duì)正式認(rèn)領(lǐng)該模型,并確認(rèn)其為旗艦?zāi)P蚆iMo-V2-Pro的內(nèi)部測試版本。這一消息引發(fā)行業(yè)關(guān)注,因?yàn)樾∶状饲霸贏I領(lǐng)域并未展現(xiàn)出如此激進(jìn)的布局。更引人注目的是,小米AI團(tuán)隊(duì)的核心人物是前DeepSeek核心研究員羅福莉,她的技術(shù)背景為這一成果增添了更多解讀空間。

在近期的小米新品發(fā)布會上,雷軍正式推出了三款自研大模型:旗艦基座模型MiMo-V2-Pro、全模態(tài)理解模型MiMo-V2-Omni以及擬人語音大模型MiMo-V2-TTS。其中,MiMo-V2-Pro作為核心產(chǎn)品,總參數(shù)量達(dá)1萬億,但通過稀疏化設(shè)計(jì)將激活參數(shù)控制在42B,支持1M超長上下文窗口。這一架構(gòu)基于改進(jìn)的MoE(Mixture-of-Experts)體系,通過動(dòng)態(tài)激活部分子網(wǎng)絡(luò),在保持計(jì)算效率的同時(shí)擴(kuò)展了模型容量。其注意力機(jī)制采用分層組合的混合設(shè)計(jì),結(jié)合局部窗口注意力與全局注意力,有效解決了長上下文場景下的推理退化問題。

從應(yīng)用場景來看,MiMo-V2-Pro的定位突破了傳統(tǒng)語言模型的邊界。它不再以生成對話為核心目標(biāo),而是作為智能體系統(tǒng)的中樞,能夠理解任務(wù)目標(biāo)、規(guī)劃執(zhí)行路徑、調(diào)用外部工具,并在多階段過程中持續(xù)修正策略。例如,在代碼生成和自動(dòng)化任務(wù)中,模型可在單次上下文中保留完整的中間狀態(tài)、工具調(diào)用結(jié)果和歷史決策路徑,避免頻繁的上下文重建。這一特性使其在匿名測試階段就展現(xiàn)出顯著優(yōu)勢,OpenRouter數(shù)據(jù)顯示,其使用場景高度集中在開發(fā)工具和復(fù)雜任務(wù)執(zhí)行領(lǐng)域。

性能評估方面,MiMo-V2-Pro在通用Agent能力測試(Claweval)中得分61.5,接近Claude Opus 4.6的水平;在PinchBench測試中躋身全球前三,編碼能力甚至超越Claude Sonnet 4.6。更引人注目的是其定價(jià)策略:在256K上下文長度內(nèi),輸入token單價(jià)為每百萬1美元,輸出為每百萬3美元;擴(kuò)展至100萬上下文時(shí),輸入單價(jià)僅升至每百萬2美元,輸出為每百萬6美元,約為Claude Opus 4.6成本的五分之一。這一價(jià)格優(yōu)勢使其在商業(yè)應(yīng)用中具備顯著競爭力。

羅福莉的技術(shù)路線選擇成為關(guān)注焦點(diǎn)。這位畢業(yè)于北京大學(xué)計(jì)算語言學(xué)研究所的研發(fā)者,曾在阿里達(dá)摩院主導(dǎo)多語言預(yù)訓(xùn)練模型VECO的開發(fā),并在DeepSeek期間參與MoE大模型DeepSeek-V2的核心設(shè)計(jì)。2025年11月加入小米后,她迅速組建團(tuán)隊(duì)并推進(jìn)1T基礎(chǔ)模型的訓(xùn)練。據(jù)其透露,模型最初的目標(biāo)是提升長上下文推理效率,而混合注意力機(jī)制的創(chuàng)新設(shè)計(jì)使其成為智能體時(shí)代的理想基礎(chǔ)。她還在社交平臺分享了團(tuán)隊(duì)管理細(xì)節(jié),例如要求成員每天與AI對話不少于100次,并表示將在模型穩(wěn)定后考慮開源。

小米的AI布局并非臨時(shí)起意。雷軍在發(fā)布會上透露,公司2025年的研發(fā)和資本投入將超過160億元,其中AI是重點(diǎn)方向。盡管此前在AI領(lǐng)域保持低調(diào),但MiMo-V2-Pro的發(fā)布標(biāo)志著小米正式加入大模型競爭行列。在全球大模型綜合智能排行榜Artificial Analysis上,該模型已位列全球第八,按品牌排名則位居第五,超越了xAI Grok等競爭對手。雷軍承認(rèn),小米的實(shí)際進(jìn)展可能比外界看到的更快,而持續(xù)投入將是其在AI時(shí)代保持競爭力的關(guān)鍵。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容