在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

小米認領(lǐng)爆款模型!雷軍稱超越馬斯克xAI,MiMo-V2-Pro將開源引期待

   發(fā)布時間:2026-03-19 12:45 作者:趙靜

近日,科技圈迎來一則重磅消息:此前在OpenRouter平臺引發(fā)廣泛關(guān)注的神秘模型Hunter Alpha,終于揭開神秘面紗,其真實身份竟是小米最新發(fā)布的MiMo-V2-Pro早期內(nèi)部測試版本。與此同時,小米正式推出MiMo-V2家族三款全新模型,除MiMo-V2-Pro外,還包括MiMo-V2-Omni和MiMo-V2-TTS,另一備受猜測的匿名模型Healer Alpha也確認對應(yīng)MiMo-V2-Omni。

一周前,Hunter Alpha悄然上線全球最大的API聚合平臺OpenRouter,憑借出色表現(xiàn)迅速成為焦點。上線后,其調(diào)用量持續(xù)攀升,連續(xù)多日占據(jù)日榜榜首,累計調(diào)用量突破1T tokens。小米官方介紹,經(jīng)過一周的持續(xù)迭代與優(yōu)化,MiMo-V2-Pro在長文處理能力以及Agent場景穩(wěn)定性方面實現(xiàn)顯著提升。雷軍也親自為新品站臺,他表示MiMo-V2-Pro在榜單上的表現(xiàn)已超越馬斯克旗下xAI的Grok,并透露小米在AI領(lǐng)域雖一直保持低調(diào),但實際進展遠超外界想象,今年在AI領(lǐng)域的研發(fā)和資本投入將超過160億元。

MiMo-V2家族的三款模型各有側(cè)重。MiMo-V2-Pro作為旗艦?zāi)P?,專為高強度Agent工作場景打造。它總參數(shù)量超過1T,激活參數(shù)為42B,采用創(chuàng)新的混合注意力架構(gòu),支持1M超長上下文。該模型在匿名測試階段就引發(fā)大量關(guān)注,OpenClaw早早給予支持。從技術(shù)規(guī)格看,相比前代MiMo-V2-Flash,其總參數(shù)量擴大約3倍,混合注意力比例從5:1提升到7:1,在參數(shù)規(guī)模增大的同時維持較高推理效率,輕量級MTP層也進一步提升了生成速度。在后訓練階段,團隊針對更廣泛的Agent場景持續(xù)Scaling,使模型逐漸能勝任真實生產(chǎn)環(huán)境中的復(fù)雜執(zhí)行工作,朝著“生產(chǎn)力系統(tǒng)的大腦”定位推進。在大模型綜合智能排行榜Artificial Analysis上,MiMo-V2-Pro位列全球第八、國內(nèi)第二。在實際使用中,它在OpenClaw、Claude Code等智能體框架中展現(xiàn)出突出的端到端任務(wù)完成能力,官方稱其整體使用體感超越Claude Sonnet 4.6,逼近Claude Opus 4.6,且API定價僅為后者的1/5。

MiMo-V2-Pro在編程領(lǐng)域也重點發(fā)力。小米內(nèi)部工程師深度評測顯示,其整體體驗接近Claude Opus 4.6,在系統(tǒng)設(shè)計、任務(wù)規(guī)劃、代碼風格以及問題解決路徑上展現(xiàn)出更高階的代碼智能。在Hunter Alpha測試階段,調(diào)用量最高的幾款應(yīng)用大多是編程工具,側(cè)面證明其在真實研發(fā)場景中具備較高的可用性和可靠性。目前,MiMo-V2-Pro已正式開放API服務(wù),支持1M上下文長度,并根據(jù)使用量分段計價:256K上下文以內(nèi),輸入1美元/百萬tokens,輸出3美元/百萬tokens;1M上下文以內(nèi),輸入2美元/百萬tokens,輸出6美元/百萬tokens。與智譜面向真實Agent長鏈路任務(wù)深度優(yōu)化的模型GLM-5-Turbo相比,小米模型定價整體略高,但此前Hunter Alpha在Claw-eval測試中擊敗了GLM-5。

MiMo-V2-Omni則瞄準現(xiàn)實世界中復(fù)雜的多模態(tài)交互與執(zhí)行場景。在音頻理解方面,它支持從環(huán)境聲分類、多說話人分離,到音頻—視覺聯(lián)合推理,再到超過10小時長音頻的連續(xù)理解,綜合表現(xiàn)超過Gemini 3 Pro,是當前最強的音頻理解基座模型之一。在圖像理解方面,展現(xiàn)出強大的多學科視覺推理與復(fù)雜圖表分析能力,效果超過Claude Opus 4.6,逼近Gemini 3 Pro等頂尖閉源模型。在視頻理解方面,支持原生音視頻聯(lián)合輸入,實現(xiàn)真正意義上的多模態(tài)視頻理解,通過創(chuàng)新性的視頻預(yù)訓練,具備更強的情境感知與未來推理能力。在與真實數(shù)字環(huán)境交互的評測基準上,其整體表現(xiàn)比肩Gemini 3 Pro。目前,MiMo-V2-Omni已正式開放API服務(wù),支持256K上下文長度,定價為輸入0.4美元/百萬tokens,輸出2美元/百萬tokens。

一同發(fā)布的MiMo-V2-TTS是一款自研的語音合成大模型。它基于自研Audio Tokenizer與多碼本語音—文本聯(lián)合建模架構(gòu),經(jīng)過上億小時語音數(shù)據(jù)的大規(guī)模預(yù)訓練和多維度強化學習,具備高度可控的多粒度語音風格控制能力。不僅能完成整體風格定調(diào),還能對局部情緒表達進行精準調(diào)節(jié)。訓練時先通過超大規(guī)模語音—文本混合預(yù)訓練建立跨模態(tài)對齊、理解和生成能力,再通過少量高質(zhì)量監(jiān)督數(shù)據(jù)微調(diào)獲得可泛化的多粒度、多風格指令控制能力。為激發(fā)模型在預(yù)訓練階段積累的高表現(xiàn)力語音生成潛力,團隊引入多維度強化學習,圍繞更自然的韻律、更穩(wěn)定的音質(zhì)、更準確的字詞表達、更高質(zhì)量的音色克隆以及不同場景下更合適的語氣與表達方式進行持續(xù)優(yōu)化。得益于多層碼本建模架構(gòu),它能在高保真的離散token空間中建模語音,最大限度保留原始語音中的豐富信息,讓強化學習階段能更直接地利用語音相關(guān)獎勵信號對模型進行優(yōu)化。

小米此次發(fā)布的三款模型,顯示出其押注一套面向Agent時代的通用智能底座的決心。此前匿名爆紅也讓市場對其他模型廠家充滿期待。近日有消息稱,DeepSeek-V4將于4月正式上線,作為梁文鋒打磨已久的多模態(tài)大模型,除在Coding能力上躍升外,還將在LTM(long term memory長期記憶)上取得突破,這恰好是智能體當前的短板之一。隨著國內(nèi)各模型廠家的戰(zhàn)略和人才調(diào)整,今年國內(nèi)大模型市場必將精彩紛呈。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容