螞蟻靈波科技近日宣布,正式開源全球規(guī)模領(lǐng)先的真實(shí)場(chǎng)景RGB-D深度數(shù)據(jù)集LingBot-Depth-Dataset,為具身智能、三維視覺等前沿領(lǐng)域提供關(guān)鍵數(shù)據(jù)支持。該數(shù)據(jù)集包含300萬(wàn)對(duì)高質(zhì)量樣本,其中200萬(wàn)對(duì)源自真實(shí)環(huán)境采集,100萬(wàn)對(duì)通過(guò)高精度渲染生成,總?cè)萘窟_(dá)2.71TB,成為當(dāng)前相關(guān)領(lǐng)域最全面的開源資源之一。
數(shù)據(jù)集設(shè)計(jì)兼顧學(xué)術(shù)研究與工業(yè)應(yīng)用需求,每條樣本均包含RGB彩色圖像、傳感器原始深度圖及真值深度圖三部分?jǐn)?shù)據(jù)。這種結(jié)構(gòu)化設(shè)計(jì)使其可直接用于深度估計(jì)、深度補(bǔ)全等任務(wù)的模型訓(xùn)練與性能評(píng)估,顯著降低相關(guān)領(lǐng)域研究者的數(shù)據(jù)獲取成本。研究團(tuán)隊(duì)特別強(qiáng)調(diào),所有真實(shí)場(chǎng)景數(shù)據(jù)均通過(guò)專業(yè)設(shè)備采集,確保了數(shù)據(jù)的高精度與場(chǎng)景多樣性。
在硬件兼容性方面,該數(shù)據(jù)集覆蓋了奧比中光Orbbec 335/335L及英特爾RealSense D405/D415/D435/D455等六款主流深度相機(jī)型號(hào)。這種多設(shè)備覆蓋特性使訓(xùn)練出的模型能夠更好地適應(yīng)不同硬件參數(shù)與成像特性,為機(jī)器人導(dǎo)航、增強(qiáng)現(xiàn)實(shí)等需要跨設(shè)備部署的應(yīng)用場(chǎng)景提供重要支撐。研究顯示,基于該數(shù)據(jù)集訓(xùn)練的模型在設(shè)備遷移測(cè)試中表現(xiàn)出更強(qiáng)的穩(wěn)定性。
據(jù)開發(fā)團(tuán)隊(duì)介紹,LingBot-Depth-Dataset的構(gòu)建歷時(shí)兩年,涉及超過(guò)50個(gè)真實(shí)場(chǎng)景的密集采集與百萬(wàn)級(jí)渲染場(chǎng)景的生成優(yōu)化。數(shù)據(jù)集中包含室內(nèi)外復(fù)雜光照條件、動(dòng)態(tài)物體干擾等挑戰(zhàn)性場(chǎng)景,能夠有效提升模型在真實(shí)環(huán)境中的魯棒性。目前該數(shù)據(jù)集已通過(guò)開源協(xié)議向全球研究者開放下載,配套提供基準(zhǔn)測(cè)試工具包與使用文檔。




















