在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

螞蟻靈波開源LingBot-World世界模型,具身智能閉環(huán)生態(tài)再進(jìn)一步

   發(fā)布時間:2026-01-30 18:03 作者:周琳

近日,一款名為LingBot-World的通用世界模型正式開源,引發(fā)科技圈廣泛關(guān)注。這款由螞蟻靈波團(tuán)隊開發(fā)的模型,不僅在視覺效果上可與DeepMind的Genie 3媲美,更在時間維度和交互性上實(shí)現(xiàn)突破,支持長達(dá)10分鐘的持續(xù)生成與實(shí)時交互。

用戶可通過鍵盤(WASD)和鼠標(biāo)控制視角移動,如同操作3A游戲般自由探索虛擬世界。更令人驚嘆的是,模型支持自然語言指令實(shí)時修改場景——輸入"前面放個煙花"或"變成冰雪世界",系統(tǒng)會從初始圖像出發(fā),按要求動態(tài)生成連貫畫面。這種"言出法隨"的交互方式,讓虛擬世界真正"活"了起來。

在技術(shù)實(shí)現(xiàn)上,LingBot-World展現(xiàn)出三大核心優(yōu)勢。首先是跨時長的一致性表現(xiàn),無論是科幻場景中的光圈特效,還是復(fù)雜環(huán)境下的物體運(yùn)動,都能保持高度連貫。其次具備長期記憶能力,即使鏡頭短暫移開,系統(tǒng)仍能準(zhǔn)確推斷離屏物體的行為軌跡。更關(guān)鍵的是,模型嚴(yán)格遵循物理規(guī)律,當(dāng)虛擬貓咪撞到沙發(fā)時,會自然產(chǎn)生碰撞反應(yīng)而非穿模而過。

該模型的成功源于獨(dú)特的技術(shù)路徑。數(shù)據(jù)層面,團(tuán)隊構(gòu)建了混合數(shù)據(jù)引擎:一方面收集海量真實(shí)世界視頻,另一方面利用虛幻引擎生成帶物理碰撞信息的合成數(shù)據(jù)。通過分層標(biāo)注策略,將視頻描述拆解為敘事、靜態(tài)場景和密集時序三個層級,幫助模型更好理解環(huán)境與運(yùn)動的解耦關(guān)系。

模型訓(xùn)練采用三階段進(jìn)化策略:預(yù)訓(xùn)練階段聚焦通用視頻生成能力,中訓(xùn)練階段通過混合專家架構(gòu)注入物理規(guī)律和交互邏輯,后訓(xùn)練階段引入因果注意力機(jī)制將推理延遲壓縮至1秒以內(nèi)。這種漸進(jìn)式優(yōu)化,使模型在長時序生成、空間記憶和實(shí)時響應(yīng)等關(guān)鍵指標(biāo)上超越同類產(chǎn)品。

值得注意的是,LingBot-World選擇完全開源的策略,與Genie 3形成鮮明對比。這一決定獲得開發(fā)者社區(qū)熱烈響應(yīng),被認(rèn)為"為具身智能研究提供了關(guān)鍵基礎(chǔ)設(shè)施"。配套發(fā)布的還有LingBot-Depth掩碼深度建模和LingBot-VLA視覺語言動作模型,三者共同構(gòu)成完整的感知-決策-模擬技術(shù)棧。

這套組合方案展現(xiàn)出強(qiáng)大的協(xié)同效應(yīng):LingBot-VLA可在虛擬環(huán)境中進(jìn)行千萬次推演,以極低成本學(xué)習(xí)物理規(guī)律;LingBot-World生成的高一致性視頻可轉(zhuǎn)化為3D點(diǎn)云數(shù)據(jù),反哺LingBot-Depth的深度感知能力;真實(shí)世界反饋又能持續(xù)優(yōu)化模擬環(huán)境的物理準(zhǔn)確性。這種閉環(huán)設(shè)計,為機(jī)器人訓(xùn)練提供了高效低成本的解決方案。

目前,項目已公開技術(shù)論文和完整代碼庫,并提供在線演示和模型權(quán)重下載。開發(fā)者可通過GitHub和項目主頁獲取詳細(xì)文檔,體驗這個能"理解"物理規(guī)律、"記住"場景變化的虛擬世界引擎。隨著社區(qū)參與度的提升,這項技術(shù)有望在機(jī)器人訓(xùn)練、游戲開發(fā)、自動駕駛等領(lǐng)域催生更多創(chuàng)新應(yīng)用。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容