MiniMax M2.5強(qiáng)勢(shì)突圍：性能成本雙優(yōu)，引爆全球Agent需求新熱潮-資訊-沃資訊

MiniMax M2.5強(qiáng)勢(shì)突圍：性能成本雙優(yōu)，引爆全球Agent需求新熱潮

發(fā)布時(shí)間：2026-02-24 15:16 來(lái)源：快訊作者：吳俊

春節(jié)期間，AI領(lǐng)域迎來(lái)一匹黑馬——MiniMax憑借其新一代模型M2.5在開(kāi)發(fā)者圈掀起熱潮。2月20日港股馬年首個(gè)交易日，MiniMax股價(jià)大漲14.52%，市值一度突破3042億港元。這一資本市場(chǎng)的積極反應(yīng)，源于M2.5在性能與市場(chǎng)表現(xiàn)上的雙重突破，為智能體（Agent）場(chǎng)景的應(yīng)用落地提供了關(guān)鍵支撐。

過(guò)去兩年，AI行業(yè)聚焦于供給側(cè)技術(shù)升級(jí)，更強(qiáng)大的模型與更高效的芯片成為主流方向，但Agent相關(guān)需求卻因技術(shù)與成本限制長(zhǎng)期被壓制。M2.5的推出恰好填補(bǔ)了這一市場(chǎng)空白。作為專(zhuān)為智能體場(chǎng)景設(shè)計(jì)的生產(chǎn)級(jí)旗艦?zāi)Ｐ停琈2.5上線僅12小時(shí)便登頂OpenRouter熱度榜，一周內(nèi)以3.07T tokens的周調(diào)用量占據(jù)平臺(tái)榜首，這一數(shù)據(jù)甚至超過(guò)Kimi K2.5、GLM-5與DeepSeek V3.2三家的總和。更關(guān)鍵的是，M2.5直接帶動(dòng)了OpenRouter平臺(tái)100K至1M長(zhǎng)文本區(qū)間的增量調(diào)用需求，而這一區(qū)間正是Agent工作流的典型消耗場(chǎng)景。此前，開(kāi)發(fā)者因缺乏能力與成本兼?zhèn)涞哪Ｐ停y以將現(xiàn)成的Agent工作流落地，M2.5的出現(xiàn)讓這一困境迎刃而解。

M2.5的技術(shù)實(shí)力在多個(gè)維度得到驗(yàn)證。在編程領(lǐng)域權(quán)威的SWE-Bench Verified評(píng)測(cè)中，其以80.2%的通過(guò)率達(dá)到Claude Opus系列水平，并在多語(yǔ)言任務(wù)Multi-SWE-Bench上排名第一。知名技術(shù)博主Simon Willison的獨(dú)立測(cè)評(píng)顯示，M2.5在主流模型中位列第三，僅次于Claude Opus 4.5和Gemini 3 Flash，且是所有開(kāi)源模型中的第一名。執(zhí)行效率方面，研究機(jī)構(gòu)SemiAnalysis實(shí)測(cè)表明，在8張H200顯卡上，M2.5每GPU每秒可穩(wěn)定處理約2500個(gè)token，即使在處理超1萬(wàn)個(gè)token的上下文時(shí)，解碼速度依然穩(wěn)定。這些數(shù)據(jù)直接證明了M2.5在性能上的硬實(shí)力。

硅谷開(kāi)發(fā)者生態(tài)對(duì)M2.5的認(rèn)可早已顯現(xiàn)。早在M2.1模型推出時(shí)，AI編程工具新貴Kilo Code便將其設(shè)為默認(rèn)模型，其CEO稱(chēng)M2.1在真實(shí)編碼工作流中可與前沿模型媲美。此次M2.5全面開(kāi)源后，模型權(quán)重在HuggingFace上線并支持本地部署，Kilo Code第一時(shí)間宣布接入，同時(shí)OpenCode、OpenClaw、Fireworks、魔搭社區(qū)等國(guó)內(nèi)外知名開(kāi)源Agent應(yīng)用與工具平臺(tái)也紛紛跟進(jìn)。開(kāi)源社區(qū)的密集接入，不僅源于M2.5的技術(shù)優(yōu)勢(shì)，更因其極具競(jìng)爭(zhēng)力的定價(jià)策略。M2.5推出兩個(gè)版本：100 TPS快速版輸入每百萬(wàn)tokens僅0.3美元、輸出2.4美元，50 TPS版本輸出價(jià)格再降一半，精準(zhǔn)落在開(kāi)源社區(qū)的成本接受區(qū)間。能力、速度與成本的平衡，讓M2.5在OpenRouter上走出近乎指數(shù)型的增長(zhǎng)曲線。

M2.5的突破并非偶然，其背后是MiniMax從工程底層重新設(shè)計(jì)的原生Agent強(qiáng)化學(xué)習(xí)系統(tǒng)——代號(hào)Forge。傳統(tǒng)RL框架存在工程復(fù)雜度高、訓(xùn)練推理一致性維護(hù)成本高的問(wèn)題，F(xiàn)orge通過(guò)引入中間件抽象層，將Agent執(zhí)行邏輯與底層訓(xùn)練推理引擎解耦。Gateway Server作為標(biāo)準(zhǔn)化通信網(wǎng)關(guān)隔離高層行為與模型復(fù)雜性，Data Pool異步收集訓(xùn)練軌跡，實(shí)現(xiàn)生成與訓(xùn)練的解耦。這一設(shè)計(jì)讓開(kāi)發(fā)者無(wú)需修改Agent內(nèi)部代碼，即可接入數(shù)百種框架、數(shù)千種工具調(diào)用格式進(jìn)行訓(xùn)練。在訓(xùn)練效率與穩(wěn)定性上，F(xiàn)orge通過(guò)Prefix Tree Merging方案將訓(xùn)練樣本重構(gòu)為樹(shù)形結(jié)構(gòu)，消除重復(fù)上下文前綴，實(shí)現(xiàn)約40倍訓(xùn)練加速并降低顯存開(kāi)銷(xiāo)；Windowed FIFO異步調(diào)度策略在最大化吞吐量的同時(shí)控制樣本離策略程度；自研CISPO算法保障MoE模型大規(guī)模訓(xùn)練穩(wěn)定性，并針對(duì)Agent長(zhǎng)軌跡信用分配難題設(shè)計(jì)復(fù)合獎(jiǎng)勵(lì)機(jī)制，解決長(zhǎng)程任務(wù)的注意力稀釋問(wèn)題。正是這套底層系統(tǒng)，讓M2.5能在Kilo、OpenClaw等嚴(yán)苛的Agent框架上穩(wěn)定運(yùn)行。

MiniMax的技術(shù)迭代速度同樣令人矚目。過(guò)去108天內(nèi)，其陸續(xù)推出M2、M2.1、M2.5三款模型，在SWE-Bench Verified榜單上的進(jìn)步速度遠(yuǎn)超Claude、GPT、Gemini系列，成為行業(yè)迭代最快的模型系列。這一節(jié)奏恰好踩中全球Agent需求爆發(fā)的窗口期——OpenClaw從默默無(wú)聞到席卷全球僅用一兩個(gè)月，OpenRouter平臺(tái)上已有上千種同類(lèi)AI工具和應(yīng)用生長(zhǎng)。在ChatGPT、Claude、Gemini“御三家”之外的新生態(tài)中，開(kāi)發(fā)者的評(píng)判標(biāo)準(zhǔn)只有一個(gè)：模型是否跑得通、用得起。M2.5的出現(xiàn)精準(zhǔn)擊穿了性能與成本的臨界點(diǎn)：能力躋身全球第一梯隊(duì)，價(jià)格僅為主流旗艦?zāi)Ｐ偷氖种唬€支持本地部署。這不僅讓MiniMax收獲了3T tokens的周調(diào)用量，更讓開(kāi)源社區(qū)中原本僅存在于Demo中的復(fù)雜多Agent系統(tǒng)首次具備大規(guī)模商業(yè)落地的經(jīng)濟(jì)可行性。全球開(kāi)發(fā)者用腳投票的結(jié)果，不僅是M2.5模型的增量，更是硅谷下一代開(kāi)源生態(tài)應(yīng)用的增量，標(biāo)志著被壓制許久的全球Agent需求正迎來(lái)真正的爆發(fā)時(shí)刻。

更多>同類(lèi)內(nèi)容