在人工智能領(lǐng)域,阿里巴巴再次展現(xiàn)強勁實力。近日,其自主研發(fā)的ABot-PhysWorld模型在世界模型權(quán)威評測平臺WorldArena中脫穎而出,成功登頂榜首。這是繼4月初HappyHorse模型在Artificial Analysis評測中奪冠后,阿里在短短半個月內(nèi)第二次斬獲國際頂級AI評測桂冠。
WorldArena評測體系由清華大學(xué)牽頭,聯(lián)合普林斯頓大學(xué)、新加坡國立大學(xué)等七所國內(nèi)外頂尖高校及科研機構(gòu)共同構(gòu)建。該評測通過16項核心指標(biāo)和3類真實場景任務(wù),對模型在物理規(guī)律理解、三維空間認(rèn)知、動態(tài)預(yù)測等關(guān)鍵能力進(jìn)行全方位檢驗。其評估標(biāo)準(zhǔn)之嚴(yán)格、測試場景之復(fù)雜,被業(yè)界視為世界模型領(lǐng)域的"終極考場"。
ABot-PhysWorld的核心突破在于其獨特的物理推理能力。傳統(tǒng)模型在模擬物體運動時,往往只能生成短時靜態(tài)畫面或簡單裝飾效果,而該模型可精準(zhǔn)預(yù)測物體在復(fù)雜交互中的運動軌跡。無論是堆疊物體的倒塌過程、流體的動態(tài)變化,還是機械結(jié)構(gòu)的聯(lián)動反應(yīng),都能保持多步驟因果邏輯的連貫性。這種能力使其在機器人任務(wù)規(guī)劃、工業(yè)異常檢測等實際應(yīng)用場景中展現(xiàn)出巨大潛力。
評測數(shù)據(jù)顯示,在涉及多物體交互的長程預(yù)測任務(wù)中,ABot-PhysWorld的準(zhǔn)確率較第二名提升23%。特別是在流體動力學(xué)模擬和剛體碰撞預(yù)測等高難度項目上,其表現(xiàn)顯著優(yōu)于GigaWorld、Google Veo等國際知名模型。專家指出,這種突破標(biāo)志著具身智能研究從"感知智能"向"認(rèn)知智能"的重要跨越。
阿里巴巴研發(fā)團(tuán)隊透露,ABot-PhysWorld采用創(chuàng)新的物理引擎與神經(jīng)網(wǎng)絡(luò)融合架構(gòu),通過構(gòu)建虛擬物理實驗室進(jìn)行強化學(xué)習(xí)。該模型在訓(xùn)練過程中模擬了超過10億種物理場景,形成對物質(zhì)世界運行規(guī)律的深度理解。目前,相關(guān)技術(shù)已應(yīng)用于物流機器人路徑規(guī)劃、智能制造缺陷檢測等多個領(lǐng)域。




















