高德ABot體系引領具身智能變革：從技術突破到生態開源加速AGI落地-汽車-沃資訊

高德ABot體系引領具身智能變革：從技術突破到生態開源加速AGI落地

發布時間：2026-04-20 10:58 來源：快訊作者：顧雨柔

在2026北京亦莊機器人半程馬拉松賽事現場，一款名為“高德途途”的四足機器人吸引了全球目光。這款由阿里巴巴旗下高德地圖研發的具身智能機器人，成功協助視障人士完成復雜避障、人群穿行等高難度任務，成為全球首款在開放環境中實現全自主運行的具身智能設備。其背后支撐的ABot全棧具身技術體系，以AGI（通用人工智能）為核心目標，通過數據引擎、基座模型與執行中樞的深度耦合，構建起“數據-模型-應用”三層飛輪式閉環系統，徹底打破了具身智能領域“實驗室完美、落地困難”的行業困局。

ABot體系的核心優勢在于其底層架構的重構。傳統具身智能研發面臨數據稀缺、仿真鴻溝、技能泛化三大痛點，而ABot通過將物理定律深度嵌入生成流程的可微分動力學引擎ABot-World，實現了虛擬訓練與真實部署的無縫銜接。該引擎采用14BDiT架構，結合千萬級真實數據與多層級采樣治理，僅需稀疏輸入即可生成厘米級高精度3D場景，大幅降低數據生成成本。在訓練技術上，首創的Diffusion-DPO物理偏好對齊框架，通過構建優劣樣本對驅動模型主動抑制違反物理規律的行為，使虛擬訓練完全貼合真實世界規則。目前，ABot-World已累計生產萬級3D真實場景、百萬級推理數據與千萬級訓練軌跡，覆蓋99%的典型生活場景，并在全球主流評測中成為唯一在物理合規性、動作可控性、零樣本泛化三大維度均達SOTA的世界模型。

在模型層，ABot-N與ABot-M構成機器人的“運動雙核”。ABot-N作為全球首個實現五大核心導航任務統一的VLA基座模型，采用層級式“大腦-動作”架構，通過多模塊協同實現單一模型覆蓋所有導航任務，在導航精度、社會合規性、零樣本泛化能力上實現斷層式領先。ABot-M則是全球首個統一架構的具身操作基座模型，首創動作流形學習技術，將學習目標由去噪重構轉為流形投影，顯著提升動作生成的穩定性與解碼效率。兩款模型累計斬獲11項權威基準SOTA，并在LIBERO、RoboCasaGR1等主流操作評測中全面超越行業強基線，多項子成果入選ICLR、CVPR等全球AI頂會。

應用層的突破體現在ABot-Claw的“MapasMemory”（地圖即記憶）理念。該執行中樞通過通用集中式Harness架構，將高德地圖與用戶私有地圖設為全局認知錨點，把多模態感知數據統一映射至共享語義空間，形成可動態刷新、持久沉淀的“世界記憶”。新機器人終端接入后，僅需讀取全局上下文即可零成本繼承環境認知，徹底粉碎場景孤島。同時，ABot-Claw采用“云端大腦—邊緣響應”兩級設計，支持多種異構機器人的并行協作與任務接力，實現任務上下文無縫移交與跨形態協同作業，標志著機器人系統從“單體智能”向“體系智能”的演進。

高德同步宣布開源ABot全棧技術體系，涵蓋數據引擎、世界模型、導航模型、操作模型、執行中樞等核心技術。此舉將直接降低行業技術研發門檻，推動具身智能從單點競爭走向生態協同。從四足機器人途途的開放場景落地，到ABot全棧體系的15項SOTA，再到全棧技術開源，高德以空間智能為核心優勢，實現了從虛擬訓練到真實部署、從單體執行到體系協同的全鏈路突破，為全球具身智能行業樹立了新的技術標桿。

更多>同類內容