資訊在沃

銀河通用聯手英偉達,打破具身智能“完美數據”迷思,指明新方向

   發布時間:2026-05-08 05:43 作者:楊凌霄

當資本爭相涌入具身智能賽道,2026年被冠以"具身智能元年"的稱號時,實驗室里的真實圖景卻呈現出截然不同的面貌。在某家頭部企業的研發中心,沒有科幻電影中自主決策的機器人,只有操作員戴著VR設備,通過手柄反復訓練機械臂完成抓取動作。這種高度依賴人工的數據采集模式,暴露出行業發展的深層困境——當前具身智能的進步,本質上是靠人力堆砌的"數據工程"。

行業主流采用的行為克隆技術,正在遭遇雙重瓶頸。技術層面,電機磨損、光線變化等環境擾動會導致"協變量偏移",使機器人動作產生誤差累積。某次機器人馬拉松比賽中設備突然失控沖向觀眾席的意外,正是這種技術缺陷的典型表現。商業層面,依賴專業操作員采集完美數據的模式,導致單次訓練成本居高不下,與"走進千家萬戶"的愿景形成尖銳矛盾。

銀河通用公司聯合英偉達、清華北大團隊提出的LDA-1B模型,為行業開辟了新路徑。該模型摒棄傳統的動作模仿框架,轉而構建"預測-推演"的世界模型。在執行推杯子動作前,系統會先在數字空間模擬重力、摩擦力等物理規律,預測物體運動軌跡。這種"先理解物理,再學習操作"的范式轉變,使模型突破了人類操作能力的天花板。

在數據處理方式上,新模型展現出顛覆性創新。傳統方案執著于像素級預測,導致算力浪費在光影變化等無關細節上。LDA-1B通過視覺基礎模型DINO提取語義特征,將關注點從"杯子反光如何變化"轉向"推力與位移的因果關系"。測試數據顯示,語義空間預測使任務成功率從14.2%躍升至55.4%,同時算力消耗降低60%。

對"完美數據"的解構更具戰略意義。研究團隊發現,包含操作失誤的低質量數據蘊含著寶貴物理規律。當在完美訓練數據中混入30%失誤樣本時,機器人執行成功率反而提升10%。這種數據利用方式的革新,意味著未來企業無需組建龐大團隊采集專業數據,轉而可通過海量野生視頻學習物理常識,構建起低成本的數據護城河。

盡管行業對"GPT時刻"充滿期待,但物理世界數據采集的特殊性,使具身智能發展仍處早期階段。當前研究提供的不是即用型解決方案,而是方向性的技術路標。它證明通過世界模型理解物理規律、利用語義特征降低算力依賴、重構數據價值鏈條的可行性,為行業突破莫拉維克悖論指明了可行路徑。這場靜悄悄的技術革命,正在改寫具身智能的底層邏輯。

 
 
更多>同類內容
全站最新
熱門內容