在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

高德ABot-M0與ABot-N0雙模型發(fā)布,補(bǔ)齊具身機(jī)器人關(guān)鍵能力新短板

   發(fā)布時(shí)間:2026-02-12 23:15 作者:趙云飛

在機(jī)器人技術(shù)領(lǐng)域,規(guī)?;瘧?yīng)用長(zhǎng)期面臨數(shù)據(jù)割裂、動(dòng)作表示不統(tǒng)一以及空間理解能力不足等難題。不同廠商、不同形態(tài)的機(jī)器人數(shù)據(jù)體系獨(dú)立,導(dǎo)致模型難以跨平臺(tái)復(fù)用,訓(xùn)練效率受限且部署成本高昂。近日,阿里巴巴集團(tuán)旗下高德推出的兩款基座模型——具身操作基座模型ABot-M0與具身導(dǎo)航基座模型ABot-N0,為解決這些問(wèn)題帶來(lái)了新的突破。

ABot-M0作為通用的具身操作基礎(chǔ)模型,從“數(shù)據(jù)統(tǒng)一—算法革新—空間感知”三個(gè)維度進(jìn)行系統(tǒng)性重構(gòu),以提升模型在多樣化機(jī)器人形態(tài)和任務(wù)場(chǎng)景下的泛化能力。在數(shù)據(jù)層面,它整合全球開(kāi)源資源,構(gòu)建了規(guī)模超600萬(wàn)條真實(shí)操作軌跡的通用機(jī)器人數(shù)據(jù)集。通過(guò)統(tǒng)一動(dòng)作表示、坐標(biāo)系與控制頻率,并采用增量式動(dòng)作建模,實(shí)現(xiàn)了跨平臺(tái)數(shù)據(jù)融合,支持完全基于公開(kāi)數(shù)據(jù)的預(yù)訓(xùn)練。

算法上,ABot-M0提出全球首個(gè)動(dòng)作流形學(xué)習(xí)。由于機(jī)器人動(dòng)作受物理規(guī)律、任務(wù)目標(biāo)與環(huán)境約束,集中分布在低維結(jié)構(gòu)化流形上,該模型設(shè)計(jì)了AML(Action Manifold Learning)算法,可直接預(yù)測(cè)結(jié)構(gòu)合理、物理可行的動(dòng)作序列,提升策略穩(wěn)定性與解碼效率。為增強(qiáng)空間感知,模型引入3D感知模塊,強(qiáng)化對(duì)“前后、遠(yuǎn)近、遮擋”等空間語(yǔ)義的理解,能在復(fù)雜環(huán)境中做出更精準(zhǔn)的操作決策。

在Libero、Libero-Plus、RoboCasa基準(zhǔn)測(cè)試中,ABot-M0在包含復(fù)雜任務(wù)組合與動(dòng)態(tài)場(chǎng)景擾動(dòng)的設(shè)定下,平均任務(wù)成功率均達(dá)到SOTA。其中,在Libero-Plus基準(zhǔn)上達(dá)到80.5%,較業(yè)界先進(jìn)方案pi0提升近30%,在高擾動(dòng)高難度具身操作任務(wù)中表現(xiàn)卓越。

導(dǎo)航是機(jī)器人進(jìn)入物理開(kāi)放世界的核心能力,但當(dāng)前具身導(dǎo)航研究存在“碎片化”問(wèn)題。主流方法針對(duì)特定任務(wù)構(gòu)建孤立專用架構(gòu),限制了模型跨任務(wù)泛化能力,阻礙智能體提取統(tǒng)一物理先驗(yàn),導(dǎo)致機(jī)器人?!碍h(huán)境看不懂、動(dòng)作做不準(zhǔn)”,復(fù)雜指令難以執(zhí)行。

高德推出的具身導(dǎo)航基座模型ABot-N0以“全任務(wù)一統(tǒng)”為目標(biāo),全球首次在單一模型中完整集成Point-Goal(點(diǎn)位導(dǎo)航)、Object-Goal(目標(biāo)導(dǎo)航)、Instruction-Following(指令跟隨)、POI-Goal(興趣點(diǎn)導(dǎo)航)與Person-Following(人物跟隨)五大導(dǎo)航任務(wù),突破了傳統(tǒng)架構(gòu)任務(wù)割裂的瓶頸。例如,當(dāng)用戶要求搭載ABot-N0的機(jī)器人“帶我去奶茶店買(mǎi)一杯奶茶,再幫我占個(gè)座”時(shí),系統(tǒng)會(huì)自動(dòng)分解任務(wù):先執(zhí)行Point-Goal接近奶茶店區(qū)域,再切換至POI-Goal鎖定店鋪入口并靠近,接著觸發(fā)Instruction-Following進(jìn)入店鋪導(dǎo)航至柜臺(tái),最后執(zhí)行Object-Goal尋找空沙發(fā)???。

ABot-N0在架構(gòu)設(shè)計(jì)、數(shù)據(jù)引擎和系統(tǒng)框架上均有關(guān)鍵革新。模型架構(gòu)采用層次化的“大腦?動(dòng)作”設(shè)計(jì)哲學(xué),“認(rèn)知大腦”理解指令并推理,“動(dòng)作專家”基于流匹配生成精確且多峰分布的連續(xù)軌跡。訓(xùn)練時(shí),先進(jìn)行認(rèn)知訓(xùn)練熱身,再用部分認(rèn)知數(shù)據(jù)和海量導(dǎo)航動(dòng)作聯(lián)合監(jiān)督微調(diào),最后用強(qiáng)化學(xué)習(xí)將導(dǎo)航?jīng)Q策對(duì)齊到人類偏好的行為價(jià)值,打造出更通用的VLA基座模型。

數(shù)據(jù)方面,依托高德長(zhǎng)期積累的場(chǎng)景資產(chǎn)和專家示例,構(gòu)建了業(yè)內(nèi)最大規(guī)模的具身導(dǎo)航數(shù)據(jù)引擎,涵蓋約8000個(gè)高保真3D場(chǎng)景等海量時(shí)空數(shù)據(jù)與近1700萬(wàn)條專家示例,增強(qiáng)了模型在真實(shí)環(huán)境中的泛化能力與魯棒性?;谶@些創(chuàng)新,ABot-N0在CityWalker、SocNav、R2R-CE/RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench七大權(quán)威基準(zhǔn)測(cè)試中全面刷新世界紀(jì)錄。其中在SocNav閉環(huán)仿真中,成功率(SR)飆升40.5%,在HM3D-OVON評(píng)測(cè)中成功率(SR)提升8.8%,均顯著優(yōu)于之前的SOTA模型。

為解決機(jī)器人在執(zhí)行長(zhǎng)程復(fù)雜任務(wù)時(shí)的任務(wù)拆解與容錯(cuò)問(wèn)題,高德提出可落地的Agentic Navigation System具身導(dǎo)航系統(tǒng)框架,形成從“讀懂指令”到“長(zhǎng)程復(fù)雜任務(wù)執(zhí)行”的閉環(huán)能力架構(gòu),支持機(jī)器人在執(zhí)行過(guò)程中持續(xù)感知、記憶、決策與糾錯(cuò)。該系統(tǒng)已成功部署于真實(shí)四足機(jī)器人平臺(tái),并在邊緣側(cè)實(shí)現(xiàn)高效推理與閉環(huán)控制,驗(yàn)證了其在動(dòng)態(tài)現(xiàn)實(shí)環(huán)境中的泛化性能與工業(yè)級(jí)穩(wěn)定性。

 
 
更多>同類內(nèi)容
全站最新
熱門(mén)內(nèi)容