在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

螞蟻集團再突破!開源萬億參數(shù)混合線性思考模型 數(shù)學(xué)競賽達金牌水準

   發(fā)布時間:2026-02-14 03:02 作者:李娜

螞蟻集團近日宣布開源全球首個基于混合線性架構(gòu)的萬億參數(shù)思考模型——Ring-2.5-1T。該模型在生成效率、推理深度和長時程任務(wù)執(zhí)行能力三大核心指標(biāo)上實現(xiàn)突破,尤其在數(shù)學(xué)競賽、長文本生成和智能體任務(wù)處理領(lǐng)域達到開源模型領(lǐng)先水平,標(biāo)志著大模型技術(shù)向復(fù)雜場景應(yīng)用邁出關(guān)鍵一步。

在數(shù)學(xué)推理能力驗證中,Ring-2.5-1T展現(xiàn)出卓越表現(xiàn)。該模型在國際數(shù)學(xué)奧林匹克競賽(IMO 2025)自測中取得35分(滿分42分),中國數(shù)學(xué)奧林匹克(CMO 2025)自測更以105分(滿分126分)遠超金牌分數(shù)線。研究人員通過對比發(fā)現(xiàn),新模型在推理邏輯嚴謹性、高級數(shù)學(xué)證明技術(shù)應(yīng)用及答案完整性方面較前代Ring-1T有顯著提升。在編程與邏輯推理基準測試中,該模型在LiveCodeBench-v6代碼生成、HMMT-25數(shù)學(xué)競賽等任務(wù)中均超越DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking等開源模型及GPT-5.2-thinking-high等閉源系統(tǒng)。

針對長時程任務(wù)處理,Ring-2.5-1T通過大規(guī)模異步智能體強化學(xué)習(xí)訓(xùn)練,在Gaia2-search智能體搜索任務(wù)中取得開源模型最優(yōu)性能。該任務(wù)要求模型協(xié)調(diào)跨應(yīng)用工具完成復(fù)雜操作,新模型在規(guī)劃生成與多步工具調(diào)用效率上較前代提升40%。在軟件工程基準測試中,其于SWE-Bench Verified任務(wù)中的表現(xiàn)超越Claude-Opus-4.5-Extended-Thinking等主流模型,展現(xiàn)出解決實際工程問題的潛力。

技術(shù)架構(gòu)層面,Ring-2.5-1T基于創(chuàng)新的Ling 2.5混合線性注意力機制,將內(nèi)存訪問開銷降低至前代的1/10。通過將分組查詢注意力(GQA)升級為1:7比例的多頭線性注意力(MLA)與Lightning Linear結(jié)構(gòu)組合,模型在32K以上長文本生成場景中吞吐量提升3倍。實驗數(shù)據(jù)顯示,在配備8塊H200 GPU的服務(wù)器上,當(dāng)生成長度超過16K token時,其解碼效率較Kimi K2架構(gòu)提升65%,且優(yōu)勢隨文本長度增加持續(xù)擴大。

該模型激活參數(shù)規(guī)模從51B擴展至63B,但通過優(yōu)化KV緩存壓縮技術(shù),在保持推理效率的同時降低了計算資源消耗。研究人員特別改進了查詢-核歸一化(QK Norm)與部分旋轉(zhuǎn)位置編碼(Partial RoPE)機制,使模型在處理超長序列時仍能維持穩(wěn)定性能。目前,Ring-2.5-1T的模型權(quán)重與推理代碼已在Hugging Face、ModelScope等平臺開放下載,官方API服務(wù)與交互體驗頁面將于近期上線。

在應(yīng)用適配方面,新模型已實現(xiàn)與Claude Code智能體編程框架及OpenClaw個人AI助手的無縫對接,支持多步規(guī)劃與工具鏈調(diào)用。技術(shù)團隊透露,通過底層架構(gòu)創(chuàng)新,Ring-2.5-1T有效解決了傳統(tǒng)模型在長文檔處理、跨文件代碼理解等場景中面臨的算力成本高、響應(yīng)延遲大等難題,為金融、法律、科研等需要深度推理的行業(yè)提供了高性能技術(shù)方案。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容