國(guó)產(chǎn)AI再創(chuàng)輝煌！上交團(tuán)隊(duì)ML-Master 2.0登頂OpenAI基準(zhǔn)，引領(lǐng)科研新范式-財(cái)經(jīng)-沃資訊

國(guó)產(chǎn)AI再創(chuàng)輝煌！上交團(tuán)隊(duì)ML-Master 2.0登頂OpenAI基準(zhǔn)，引領(lǐng)科研新范式

發(fā)布時(shí)間：2025-12-25 14:48 來(lái)源：快訊作者：沈如風(fēng)

在AI科研領(lǐng)域，一場(chǎng)由中國(guó)團(tuán)隊(duì)引領(lǐng)的變革正在悄然發(fā)生。由上海交通大學(xué)人工智能學(xué)院、上海算法創(chuàng)新研究院與深勢(shì)科技聯(lián)合組建的SciMaster團(tuán)隊(duì)，近日憑借其自主研發(fā)的AI機(jī)器學(xué)習(xí)專家ML-Master 2.0，在OpenAI設(shè)立的權(quán)威基準(zhǔn)測(cè)試MLE-bench中力壓國(guó)際科技巨頭，以56.44%的獎(jiǎng)牌率登頂全球榜首。這一突破不僅標(biāo)志著中國(guó)在AI驅(qū)動(dòng)科研領(lǐng)域的技術(shù)實(shí)力，更展現(xiàn)了國(guó)產(chǎn)開源大模型DeepSeek-V3.2-Speciale的強(qiáng)大潛力。

傳統(tǒng)AI在科研中的應(yīng)用往往局限于短程任務(wù)，例如生成代碼或解答特定問(wèn)題。然而，真實(shí)科研場(chǎng)景遠(yuǎn)比想象復(fù)雜：科研人員需要經(jīng)歷假設(shè)設(shè)定、實(shí)驗(yàn)設(shè)計(jì)、代碼調(diào)試、結(jié)果分析的完整閉環(huán)，這個(gè)過(guò)程可能持續(xù)數(shù)小時(shí)甚至數(shù)天，且失敗是常態(tài)。SciMaster團(tuán)隊(duì)敏銳捕捉到這一痛點(diǎn)，將ML-Master 2.0定位為“為真實(shí)機(jī)器學(xué)習(xí)工程而生”的自主智能體，其核心目標(biāo)是在無(wú)人工干預(yù)的條件下，實(shí)現(xiàn)超長(zhǎng)程自主探索。

ML-Master 2.0的突破性在于其“超長(zhǎng)程自主”能力。團(tuán)隊(duì)摒棄了將上下文視為一次性推理材料的傳統(tǒng)思路，轉(zhuǎn)而構(gòu)建了一套層次化認(rèn)知緩存（HCC）機(jī)制。該機(jī)制將科研過(guò)程中的認(rèn)知資產(chǎn)分為三個(gè)層級(jí)：即時(shí)經(jīng)驗(yàn)（Experience）服務(wù)于當(dāng)前決策，穩(wěn)定知識(shí)（Knowledge）在任務(wù)中反復(fù)調(diào)用，先驗(yàn)智慧（Wisdom）則跨任務(wù)遷移復(fù)用。通過(guò)動(dòng)態(tài)篩選和層級(jí)提升，系統(tǒng)既能避免“上下文爆炸”導(dǎo)致的混亂，又能防止“遺忘歷史”造成的重復(fù)試錯(cuò)，從而在長(zhǎng)達(dá)數(shù)十小時(shí)的探索中保持方向穩(wěn)定。

在MLE-bench的評(píng)測(cè)中，ML-Master 2.0展現(xiàn)了顯著優(yōu)勢(shì)。該基準(zhǔn)測(cè)試要求AI在真實(shí)機(jī)器學(xué)習(xí)工程場(chǎng)景中完成實(shí)驗(yàn)設(shè)計(jì)、代碼實(shí)現(xiàn)、調(diào)試修正等完整流程，其難度遠(yuǎn)超理想化的答題任務(wù)。測(cè)試結(jié)果顯示，ML-Master 2.0的獎(jiǎng)牌率較Google、meta等團(tuán)隊(duì)基于閉源模型的智能體提升28.3%，且全程無(wú)需人工干預(yù)。這一成績(jī)的取得，得益于其基于國(guó)產(chǎn)大模型DeepSeek-V3.2-Speciale的架構(gòu)優(yōu)化，以及HCC機(jī)制對(duì)長(zhǎng)期試錯(cuò)經(jīng)驗(yàn)的高效積累。

目前，ML-Master 2.0已進(jìn)入實(shí)際應(yīng)用階段。在理論計(jì)算物理領(lǐng)域，它協(xié)助科研人員模擬復(fù)雜量子系統(tǒng)，通過(guò)自主調(diào)整實(shí)驗(yàn)參數(shù)，顯著縮短了模擬周期；在具身智能機(jī)器人訓(xùn)練中，其超長(zhǎng)程自主能力使機(jī)器人能夠持續(xù)優(yōu)化動(dòng)作策略，無(wú)需頻繁人工重置。這些落地案例證明，ML-Master 2.0不僅能在評(píng)測(cè)中領(lǐng)先，更能解決真實(shí)科研中的關(guān)鍵問(wèn)題。

為推動(dòng)技術(shù)普惠，SciMaster團(tuán)隊(duì)已將ML-Master 2.0的核心代碼開源，并通過(guò)SciMaster平臺(tái)逐步開放產(chǎn)品化能力。目前，該平臺(tái)已上線Waiting List申請(qǐng)通道，感興趣的研究者和工程團(tuán)隊(duì)可通過(guò)“SciMaster的朋友圈”提前體驗(yàn)。這一舉措不僅降低了AI科研工具的使用門檻，更為全球AI4Science社區(qū)提供了中國(guó)方案的參考。

從科幻作品中的“智子”到現(xiàn)實(shí)中的自主AI科學(xué)家，人類對(duì)智能體探索科學(xué)的想象正逐步成真。ML-Master 2.0的突破表明，通過(guò)將認(rèn)知過(guò)程視為可積累、可演化的資源，AI已具備在真實(shí)科研環(huán)境中長(zhǎng)期成長(zhǎng)的能力。在這場(chǎng)全球競(jìng)逐中，中國(guó)團(tuán)隊(duì)正以開源大模型為基石，書寫屬于自己的篇章。

更多>同類內(nèi)容