一区二区三区国产亚洲网站,我和亲妺婷婷在浴室作爱经过,一本到精品免费高清在线观看

小米機器人新突破：Xiaomi-Robotics-0發(fā)布，消費級顯卡助力具身智能普及

發(fā)布時間：2026-02-12 15:58 來源：快訊作者：鄭佳

雷軍在微博上宣布，小米機器人團隊正式推出并開源了一款全新的具身智能VLA模型——Xiaomi-Robotics-0，同時首次公開了該模型在真實機器人上的運行畫面。這一發(fā)布標志著小米在機器人領(lǐng)域邁出了重要一步，解決了多項行業(yè)長期存在的技術(shù)難題。

Xiaomi-Robotics-0擁有47億參數(shù)，集成了視覺語言理解與高性能實時執(zhí)行能力。該模型在三大主流仿真測試中表現(xiàn)優(yōu)異，全面超越行業(yè)標桿，取得全項SOTA成績。更令人矚目的是，它在真實機器人上實現(xiàn)了流暢的動作表現(xiàn)，徹底改變了傳統(tǒng)機器人動作卡頓、反應(yīng)遲緩的形象。

傳統(tǒng)VLA模型面臨兩大核心挑戰(zhàn)：一是推理延遲高導(dǎo)致動作不連貫，二是依賴昂貴專業(yè)顯卡，硬件門檻高。這些問題使得先進機器人技術(shù)難以走出實驗室，無法在現(xiàn)實場景中廣泛應(yīng)用。Xiaomi-Robotics-0通過創(chuàng)新設(shè)計，成功突破了這些限制。

該模型最大的突破在于能在普通消費級顯卡上實現(xiàn)實時推理，大幅降低了技術(shù)落地成本。這一特性使其區(qū)別于同類產(chǎn)品，為更多開發(fā)者和研究機構(gòu)提供了接觸前沿技術(shù)的機會。小米通過自研的Mixture-of-Transformers混合架構(gòu)，為機器人構(gòu)建了"雙腦協(xié)同系統(tǒng)"，有效解決了傳統(tǒng)模型存在的效率問題。

這個雙腦系統(tǒng)由視覺語言大腦（VLM）和動作執(zhí)行小腦（DiT）組成。VLM負責理解人類指令和環(huán)境信息，能夠準確解析模糊指令中的空間關(guān)系和任務(wù)目標；DiT則專注于將指令轉(zhuǎn)化為流暢動作，通過流匹配技術(shù)確保動作精準穩(wěn)定。這種設(shè)計使機器人動作更加自然，接近人類操作水平。

研發(fā)團隊采用兩階段訓(xùn)練方案提升模型性能。第一階段通過跨模態(tài)預(yù)訓(xùn)練，使模型在掌握動作技能的同時保持基礎(chǔ)認知能力；第二階段通過后訓(xùn)練優(yōu)化，解決真機運行中的動作斷層問題。這些技術(shù)改進使機器人能夠穩(wěn)定完成疊毛巾、拆積木等復(fù)雜物理任務(wù)。

從公開的真機演示視頻可以看到，機器人處理柔性物體時表現(xiàn)出色，能夠自動調(diào)整動作策略完成疊放任務(wù)；操作剛性積木時手眼協(xié)調(diào)穩(wěn)定，動作精準無誤。這種對不同材質(zhì)物體的適應(yīng)能力，展現(xiàn)了模型強大的物理智能和環(huán)境感知能力。

在Libero、Calvin、SimplerEnv等國際主流測試集中，Xiaomi-Robotics-0與超過30款主流模型對標，在所有基準測試中均取得最優(yōu)成績。這些數(shù)據(jù)證實了該模型在仿真環(huán)境和真實場景中的全面領(lǐng)先地位。

小米此次選擇將技術(shù)成果全量開源，包括技術(shù)文檔、GitHub代碼和Hugging Face模型權(quán)重全部公開。這一舉措打破了行業(yè)技術(shù)壁壘，使全球開發(fā)者都能免費使用和二次開發(fā)相關(guān)資源，將加速具身智能技術(shù)的普及和應(yīng)用創(chuàng)新。

雷軍透露，小米已持續(xù)多年布局機器人領(lǐng)域，目前仍在全球招募頂尖人才。此次發(fā)布的Xiaomi-Robotics-0只是階段性成果，團隊正在攻關(guān)下一代技術(shù)，未來將帶來更多創(chuàng)新突破。

更多>同類內(nèi)容

小米機器人新突破：Xiaomi-Robotics-0發(fā)布，消費級顯卡助力具身智能普及

小米機器人新突破：Xiaomi-Robotics-0發(fā)布，消費級顯卡助力具身智能普及