久久伊人精品影院一本到综合,日本精品视频一区在线播放

高德ABot-M0與ABot-N0雙模型發(fā)布，補(bǔ)齊具身機(jī)器人關(guān)鍵能力新短板

發(fā)布時(shí)間：2026-02-12 23:15 來(lái)源：互聯(lián)網(wǎng) 作者：趙云飛

在機(jī)器人技術(shù)領(lǐng)域，規(guī)?；瘧?yīng)用長(zhǎng)期面臨數(shù)據(jù)割裂、動(dòng)作表示不統(tǒng)一以及空間理解能力不足等難題。不同廠商、不同形態(tài)的機(jī)器人數(shù)據(jù)體系獨(dú)立，導(dǎo)致模型難以跨平臺(tái)復(fù)用，訓(xùn)練效率受限且部署成本高昂。近日，阿里巴巴集團(tuán)旗下高德推出的兩款基座模型——具身操作基座模型ABot-M0與具身導(dǎo)航基座模型ABot-N0，為解決這些問(wèn)題帶來(lái)了新的突破。

ABot-M0作為通用的具身操作基礎(chǔ)模型，從“數(shù)據(jù)統(tǒng)一—算法革新—空間感知”三個(gè)維度進(jìn)行系統(tǒng)性重構(gòu)，以提升模型在多樣化機(jī)器人形態(tài)和任務(wù)場(chǎng)景下的泛化能力。在數(shù)據(jù)層面，它整合全球開(kāi)源資源，構(gòu)建了規(guī)模超600萬(wàn)條真實(shí)操作軌跡的通用機(jī)器人數(shù)據(jù)集。通過(guò)統(tǒng)一動(dòng)作表示、坐標(biāo)系與控制頻率，并采用增量式動(dòng)作建模，實(shí)現(xiàn)了跨平臺(tái)數(shù)據(jù)融合，支持完全基于公開(kāi)數(shù)據(jù)的預(yù)訓(xùn)練。

算法上，ABot-M0提出全球首個(gè)動(dòng)作流形學(xué)習(xí)。由于機(jī)器人動(dòng)作受物理規(guī)律、任務(wù)目標(biāo)與環(huán)境約束，集中分布在低維結(jié)構(gòu)化流形上，該模型設(shè)計(jì)了AML（Action Manifold Learning）算法，可直接預(yù)測(cè)結(jié)構(gòu)合理、物理可行的動(dòng)作序列，提升策略穩(wěn)定性與解碼效率。為增強(qiáng)空間感知，模型引入3D感知模塊，強(qiáng)化對(duì)“前后、遠(yuǎn)近、遮擋”等空間語(yǔ)義的理解，能在復(fù)雜環(huán)境中做出更精準(zhǔn)的操作決策。

在Libero、Libero-Plus、RoboCasa基準(zhǔn)測(cè)試中，ABot-M0在包含復(fù)雜任務(wù)組合與動(dòng)態(tài)場(chǎng)景擾動(dòng)的設(shè)定下，平均任務(wù)成功率均達(dá)到SOTA。其中，在Libero-Plus基準(zhǔn)上達(dá)到80.5%，較業(yè)界先進(jìn)方案pi0提升近30%，在高擾動(dòng)高難度具身操作任務(wù)中表現(xiàn)卓越。

導(dǎo)航是機(jī)器人進(jìn)入物理開(kāi)放世界的核心能力，但當(dāng)前具身導(dǎo)航研究存在“碎片化”問(wèn)題。主流方法針對(duì)特定任務(wù)構(gòu)建孤立專用架構(gòu)，限制了模型跨任務(wù)泛化能力，阻礙智能體提取統(tǒng)一物理先驗(yàn)，導(dǎo)致機(jī)器人?！碍h(huán)境看不懂、動(dòng)作做不準(zhǔn)”，復(fù)雜指令難以執(zhí)行。

高德推出的具身導(dǎo)航基座模型ABot-N0以“全任務(wù)一統(tǒng)”為目標(biāo)，全球首次在單一模型中完整集成Point-Goal（點(diǎn)位導(dǎo)航）、Object-Goal（目標(biāo)導(dǎo)航）、Instruction-Following（指令跟隨）、POI-Goal（興趣點(diǎn)導(dǎo)航）與Person-Following（人物跟隨）五大導(dǎo)航任務(wù)，突破了傳統(tǒng)架構(gòu)任務(wù)割裂的瓶頸。例如，當(dāng)用戶要求搭載ABot-N0的機(jī)器人“帶我去奶茶店買(mǎi)一杯奶茶，再幫我占個(gè)座”時(shí)，系統(tǒng)會(huì)自動(dòng)分解任務(wù)：先執(zhí)行Point-Goal接近奶茶店區(qū)域，再切換至POI-Goal鎖定店鋪入口并靠近，接著觸發(fā)Instruction-Following進(jìn)入店鋪導(dǎo)航至柜臺(tái)，最后執(zhí)行Object-Goal尋找空沙發(fā)?？?。

ABot-N0在架構(gòu)設(shè)計(jì)、數(shù)據(jù)引擎和系統(tǒng)框架上均有關(guān)鍵革新。模型架構(gòu)采用層次化的“大腦?動(dòng)作”設(shè)計(jì)哲學(xué)，“認(rèn)知大腦”理解指令并推理，“動(dòng)作專家”基于流匹配生成精確且多峰分布的連續(xù)軌跡。訓(xùn)練時(shí)，先進(jìn)行認(rèn)知訓(xùn)練熱身，再用部分認(rèn)知數(shù)據(jù)和海量導(dǎo)航動(dòng)作聯(lián)合監(jiān)督微調(diào)，最后用強(qiáng)化學(xué)習(xí)將導(dǎo)航?jīng)Q策對(duì)齊到人類偏好的行為價(jià)值，打造出更通用的VLA基座模型。

數(shù)據(jù)方面，依托高德長(zhǎng)期積累的場(chǎng)景資產(chǎn)和專家示例，構(gòu)建了業(yè)內(nèi)最大規(guī)模的具身導(dǎo)航數(shù)據(jù)引擎，涵蓋約8000個(gè)高保真3D場(chǎng)景等海量時(shí)空數(shù)據(jù)與近1700萬(wàn)條專家示例，增強(qiáng)了模型在真實(shí)環(huán)境中的泛化能力與魯棒性?；谶@些創(chuàng)新，ABot-N0在CityWalker、SocNav、R2R-CE/RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench七大權(quán)威基準(zhǔn)測(cè)試中全面刷新世界紀(jì)錄。其中在SocNav閉環(huán)仿真中，成功率（SR）飆升40.5%，在HM3D-OVON評(píng)測(cè)中成功率（SR）提升8.8%，均顯著優(yōu)于之前的SOTA模型。

為解決機(jī)器人在執(zhí)行長(zhǎng)程復(fù)雜任務(wù)時(shí)的任務(wù)拆解與容錯(cuò)問(wèn)題，高德提出可落地的Agentic Navigation System具身導(dǎo)航系統(tǒng)框架，形成從“讀懂指令”到“長(zhǎng)程復(fù)雜任務(wù)執(zhí)行”的閉環(huán)能力架構(gòu)，支持機(jī)器人在執(zhí)行過(guò)程中持續(xù)感知、記憶、決策與糾錯(cuò)。該系統(tǒng)已成功部署于真實(shí)四足機(jī)器人平臺(tái)，并在邊緣側(cè)實(shí)現(xiàn)高效推理與閉環(huán)控制，驗(yàn)證了其在動(dòng)態(tài)現(xiàn)實(shí)環(huán)境中的泛化性能與工業(yè)級(jí)穩(wěn)定性。

更多>同類內(nèi)容

高德ABot-M0與ABot-N0雙模型發(fā)布，補(bǔ)齊具身機(jī)器人關(guān)鍵能力新短板

高德ABot-M0與ABot-N0雙模型發(fā)布，補(bǔ)齊具身機(jī)器人關(guān)鍵能力新短板