在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

小米機器人新突破:Xiaomi-Robotics-0發(fā)布,消費級顯卡助力具身智能普及

   發(fā)布時間:2026-02-12 15:58 作者:鄭佳

雷軍在微博上宣布,小米機器人團隊正式推出并開源了一款全新的具身智能VLA模型——Xiaomi-Robotics-0,同時首次公開了該模型在真實機器人上的運行畫面。這一發(fā)布標志著小米在機器人領(lǐng)域邁出了重要一步,解決了多項行業(yè)長期存在的技術(shù)難題。

Xiaomi-Robotics-0擁有47億參數(shù),集成了視覺語言理解與高性能實時執(zhí)行能力。該模型在三大主流仿真測試中表現(xiàn)優(yōu)異,全面超越行業(yè)標桿,取得全項SOTA成績。更令人矚目的是,它在真實機器人上實現(xiàn)了流暢的動作表現(xiàn),徹底改變了傳統(tǒng)機器人動作卡頓、反應(yīng)遲緩的形象。

傳統(tǒng)VLA模型面臨兩大核心挑戰(zhàn):一是推理延遲高導(dǎo)致動作不連貫,二是依賴昂貴專業(yè)顯卡,硬件門檻高。這些問題使得先進機器人技術(shù)難以走出實驗室,無法在現(xiàn)實場景中廣泛應(yīng)用。Xiaomi-Robotics-0通過創(chuàng)新設(shè)計,成功突破了這些限制。

該模型最大的突破在于能在普通消費級顯卡上實現(xiàn)實時推理,大幅降低了技術(shù)落地成本。這一特性使其區(qū)別于同類產(chǎn)品,為更多開發(fā)者和研究機構(gòu)提供了接觸前沿技術(shù)的機會。小米通過自研的Mixture-of-Transformers混合架構(gòu),為機器人構(gòu)建了"雙腦協(xié)同系統(tǒng)",有效解決了傳統(tǒng)模型存在的效率問題。

這個雙腦系統(tǒng)由視覺語言大腦(VLM)和動作執(zhí)行小腦(DiT)組成。VLM負責理解人類指令和環(huán)境信息,能夠準確解析模糊指令中的空間關(guān)系和任務(wù)目標;DiT則專注于將指令轉(zhuǎn)化為流暢動作,通過流匹配技術(shù)確保動作精準穩(wěn)定。這種設(shè)計使機器人動作更加自然,接近人類操作水平。

研發(fā)團隊采用兩階段訓(xùn)練方案提升模型性能。第一階段通過跨模態(tài)預(yù)訓(xùn)練,使模型在掌握動作技能的同時保持基礎(chǔ)認知能力;第二階段通過后訓(xùn)練優(yōu)化,解決真機運行中的動作斷層問題。這些技術(shù)改進使機器人能夠穩(wěn)定完成疊毛巾、拆積木等復(fù)雜物理任務(wù)。

從公開的真機演示視頻可以看到,機器人處理柔性物體時表現(xiàn)出色,能夠自動調(diào)整動作策略完成疊放任務(wù);操作剛性積木時手眼協(xié)調(diào)穩(wěn)定,動作精準無誤。這種對不同材質(zhì)物體的適應(yīng)能力,展現(xiàn)了模型強大的物理智能和環(huán)境感知能力。

在Libero、Calvin、SimplerEnv等國際主流測試集中,Xiaomi-Robotics-0與超過30款主流模型對標,在所有基準測試中均取得最優(yōu)成績。這些數(shù)據(jù)證實了該模型在仿真環(huán)境和真實場景中的全面領(lǐng)先地位。

小米此次選擇將技術(shù)成果全量開源,包括技術(shù)文檔、GitHub代碼和Hugging Face模型權(quán)重全部公開。這一舉措打破了行業(yè)技術(shù)壁壘,使全球開發(fā)者都能免費使用和二次開發(fā)相關(guān)資源,將加速具身智能技術(shù)的普及和應(yīng)用創(chuàng)新。

雷軍透露,小米已持續(xù)多年布局機器人領(lǐng)域,目前仍在全球招募頂尖人才。此次發(fā)布的Xiaomi-Robotics-0只是階段性成果,團隊正在攻關(guān)下一代技術(shù),未來將帶來更多創(chuàng)新突破。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容