在人工智能領(lǐng)域,阿里巴巴再次展現(xiàn)出強勁的技術(shù)實力。近日,其自主研發(fā)的世界模型ABot-PhysWorld在國際權(quán)威評測平臺WorldArena上脫穎而出,成功登頂榜首。這一成績距離阿里巴巴另一款模型HappyHorse在Artificial Analysis榜單奪冠還不到半個月,標志著該公司在AI模型研發(fā)方面持續(xù)取得突破。
WorldArena評測體系由清華大學牽頭,聯(lián)合普林斯頓大學、新加坡國立大學、北京大學、香港大學、中國科學院、上海交通大學和中國科學技術(shù)大學等八所頂尖學府共同建立。該平臺通過16項核心指標和3大實際應用任務,對模型在感知精度、物理規(guī)律理解、三維空間認知以及動作預測等維度進行全面評估,被視為世界模型領(lǐng)域的"試金石"。
ABot-PhysWorld的突出優(yōu)勢在于其對物理規(guī)律的深度掌握和長程動態(tài)預測能力。與傳統(tǒng)模型只能生成短時靜態(tài)畫面不同,該模型能夠精準模擬物體在復雜交互中的運動軌跡,包括滑動、傾倒、堆疊等物理現(xiàn)象,甚至能預測流體變化過程。在多步因果推理測試中,其表現(xiàn)出的邏輯一致性顯著優(yōu)于同類產(chǎn)品。
這種突破性能力使ABot-PhysWorld具備實際應用價值。在工業(yè)自動化場景中,模型可提前預判設備異常;在機器人控制領(lǐng)域,能夠?qū)崿F(xiàn)更精準的任務規(guī)劃;在自動駕駛系統(tǒng)里,則能提升對復雜路況的應對能力。相較于僅停留在視覺展示層面的技術(shù),該模型真正實現(xiàn)了從"看懂"到"理解"的跨越。
據(jù)評測數(shù)據(jù)顯示,ABot-PhysWorld在流體動力學模擬、多物體交互預測等關(guān)鍵指標上領(lǐng)先第二名超過15%。特別是在需要連續(xù)推理的復雜場景中,其準確率達到92.7%,創(chuàng)下該評測體系的新紀錄。參與評測的專家指出,這種級別的物理引擎模擬能力,標志著具身智能發(fā)展進入新階段。
此次雙模型連續(xù)登頂國際榜單,印證了阿里巴巴在基礎模型研發(fā)領(lǐng)域的持續(xù)投入已見成效。從語言大模型到世界模型,該公司正構(gòu)建覆蓋感知、認知、決策的全鏈條AI技術(shù)體系,為人工智能技術(shù)在實體經(jīng)濟的落地應用奠定基礎。





















