資訊在沃

高德ABot體系引領具身智能變革:從技術突破到生態開源加速AGI落地

   發布時間:2026-04-20 10:58 作者:顧雨柔

在2026北京亦莊機器人半程馬拉松賽事現場,一款名為“高德途途”的四足機器人吸引了全球目光。這款由阿里巴巴旗下高德地圖研發的具身智能機器人,成功協助視障人士完成復雜避障、人群穿行等高難度任務,成為全球首款在開放環境中實現全自主運行的具身智能設備。其背后支撐的ABot全棧具身技術體系,以AGI(通用人工智能)為核心目標,通過數據引擎、基座模型與執行中樞的深度耦合,構建起“數據-模型-應用”三層飛輪式閉環系統,徹底打破了具身智能領域“實驗室完美、落地困難”的行業困局。

ABot體系的核心優勢在于其底層架構的重構。傳統具身智能研發面臨數據稀缺、仿真鴻溝、技能泛化三大痛點,而ABot通過將物理定律深度嵌入生成流程的可微分動力學引擎ABot-World,實現了虛擬訓練與真實部署的無縫銜接。該引擎采用14BDiT架構,結合千萬級真實數據與多層級采樣治理,僅需稀疏輸入即可生成厘米級高精度3D場景,大幅降低數據生成成本。在訓練技術上,首創的Diffusion-DPO物理偏好對齊框架,通過構建優劣樣本對驅動模型主動抑制違反物理規律的行為,使虛擬訓練完全貼合真實世界規則。目前,ABot-World已累計生產萬級3D真實場景、百萬級推理數據與千萬級訓練軌跡,覆蓋99%的典型生活場景,并在全球主流評測中成為唯一在物理合規性、動作可控性、零樣本泛化三大維度均達SOTA的世界模型。

在模型層,ABot-N與ABot-M構成機器人的“運動雙核”。ABot-N作為全球首個實現五大核心導航任務統一的VLA基座模型,采用層級式“大腦-動作”架構,通過多模塊協同實現單一模型覆蓋所有導航任務,在導航精度、社會合規性、零樣本泛化能力上實現斷層式領先。ABot-M則是全球首個統一架構的具身操作基座模型,首創動作流形學習技術,將學習目標由去噪重構轉為流形投影,顯著提升動作生成的穩定性與解碼效率。兩款模型累計斬獲11項權威基準SOTA,并在LIBERO、RoboCasaGR1等主流操作評測中全面超越行業強基線,多項子成果入選ICLR、CVPR等全球AI頂會。

應用層的突破體現在ABot-Claw的“MapasMemory”(地圖即記憶)理念。該執行中樞通過通用集中式Harness架構,將高德地圖與用戶私有地圖設為全局認知錨點,把多模態感知數據統一映射至共享語義空間,形成可動態刷新、持久沉淀的“世界記憶”。新機器人終端接入后,僅需讀取全局上下文即可零成本繼承環境認知,徹底粉碎場景孤島。同時,ABot-Claw采用“云端大腦—邊緣響應”兩級設計,支持多種異構機器人的并行協作與任務接力,實現任務上下文無縫移交與跨形態協同作業,標志著機器人系統從“單體智能”向“體系智能”的演進。

高德同步宣布開源ABot全棧技術體系,涵蓋數據引擎、世界模型、導航模型、操作模型、執行中樞等核心技術。此舉將直接降低行業技術研發門檻,推動具身智能從單點競爭走向生態協同。從四足機器人途途的開放場景落地,到ABot全棧體系的15項SOTA,再到全棧技術開源,高德以空間智能為核心優勢,實現了從虛擬訓練到真實部署、從單體執行到體系協同的全鏈路突破,為全球具身智能行業樹立了新的技術標桿。

 
 
更多>同類內容
全站最新
熱門內容