人形機器人正從實驗室邁向更廣闊的應(yīng)用場景。從特斯拉Optimus進入工廠作業(yè),到搭載腦機接口技術(shù)的康復(fù)機器人投入使用,再到上緯啟元推出首款可“二次開發(fā)”的個人機器人Q1,這些創(chuàng)新產(chǎn)品標(biāo)志著人形機器人開始深度融入科研、創(chuàng)作和家庭生活等領(lǐng)域。市場研究機構(gòu)IDC預(yù)測,2025年全球人形機器人市場將進入快速增長期,文娛商演、科研教育、工業(yè)制造、倉儲物流等場景將成為主要需求方向。
隨著應(yīng)用場景不斷拓展,數(shù)據(jù)瓶頸成為制約具身智能發(fā)展的關(guān)鍵因素。與自動駕駛和通用大模型不同,人形機器人需要記錄在真實物理世界中完成接觸、施力、協(xié)同等動作的全過程數(shù)據(jù)。這類數(shù)據(jù)不僅采集成本高昂,且標(biāo)注復(fù)雜度遠(yuǎn)超傳統(tǒng)數(shù)據(jù)類型。上海某科研機構(gòu)負(fù)責(zé)人指出,僅依賴公開視頻或仿真數(shù)據(jù)無法捕捉觸覺、接觸力等關(guān)鍵物理信息,機器人難以通過視頻學(xué)習(xí)如何精準(zhǔn)施力。
行業(yè)正通過構(gòu)建高質(zhì)量數(shù)據(jù)集突破這一困境。國家地方共建人形機器人創(chuàng)新中心聯(lián)合上海緯鈦科技發(fā)布的“白虎-VTouch”數(shù)據(jù)集,成為全球首個大規(guī)模跨本體視觸覺多模態(tài)數(shù)據(jù)集。該數(shù)據(jù)集包含視觸覺傳感器數(shù)據(jù)、RGB-D數(shù)據(jù)和關(guān)節(jié)位姿信息,覆蓋輪臂機器人、雙足機器人及手持終端等多種構(gòu)型,數(shù)據(jù)規(guī)模超過6萬分鐘。其創(chuàng)新之處在于采用“矩陣式”任務(wù)設(shè)計,從雙臂協(xié)同結(jié)構(gòu)、原子操作類型、接觸模式三個維度構(gòu)建了380余種任務(wù)類型,涵蓋家居、工業(yè)、餐飲等四大類場景。
數(shù)據(jù)質(zhì)量與結(jié)構(gòu)的重要性引發(fā)行業(yè)深度思考。傅利葉CEO顧捷提出,單純追求數(shù)據(jù)規(guī)模意義有限,真正有價值的數(shù)據(jù)應(yīng)包含不同任務(wù)間的切換過程以及成功與失敗的完整記錄。他建議構(gòu)建“三明治式”數(shù)據(jù)結(jié)構(gòu):以公開視頻作為基礎(chǔ)層,補充人類第一視角的操作數(shù)據(jù),再疊加少量高價值的機器人實采數(shù)據(jù)。這種模式既能降低采集成本,又能確保數(shù)據(jù)反映真實操作意圖。
數(shù)據(jù)競爭正推動技術(shù)生態(tài)向底層延伸。多模態(tài)傳感器和視觸覺融合技術(shù)的突破,使物理交互數(shù)據(jù)采集成為可能;與此同時,數(shù)據(jù)格式標(biāo)準(zhǔn)化、標(biāo)注體系統(tǒng)一化的需求日益迫切。庫帕思與它石智航近期宣布合作推進具身數(shù)據(jù)標(biāo)準(zhǔn)建設(shè),傅利葉則聯(lián)合醫(yī)療機構(gòu)發(fā)起“腦機具身·數(shù)據(jù)引擎聯(lián)合創(chuàng)新計劃”,嘗試在康復(fù)場景中打通腦機接口與具身智能的數(shù)據(jù)閉環(huán)。這些舉措標(biāo)志著行業(yè)開始從技術(shù)競賽轉(zhuǎn)向生態(tài)共建。





















