在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

阿里千問Qwen3-Coder-Next發(fā)布:以低推理成本解鎖高效編程智能體新可能

   發(fā)布時間:2026-02-04 11:03 作者:趙云飛

阿里巴巴千問團隊近日正式發(fā)布了一款名為Qwen3-Coder-Next的開放權(quán)重語言模型,該模型專為編碼代理和本地開發(fā)場景設(shè)計,通過創(chuàng)新架構(gòu)與訓(xùn)練方法實現(xiàn)了性能與效率的顯著提升。與傳統(tǒng)的參數(shù)擴展模式不同,新模型聚焦于智能體訓(xùn)練信號的擴展,采用混合注意力機制與MoE(專家混合)架構(gòu),在降低推理成本的同時強化了編程能力與智能體交互水平。

在訓(xùn)練方法上,團隊構(gòu)建了多階段強化體系:首先通過持續(xù)預(yù)訓(xùn)練讓模型吸收代碼與智能體相關(guān)數(shù)據(jù),隨后利用高質(zhì)量智能體軌跡數(shù)據(jù)進行監(jiān)督微調(diào),并針對軟件工程、QA測試、Web/UX開發(fā)等垂直領(lǐng)域開展專家訓(xùn)練。最終通過知識蒸餾技術(shù)將專家能力整合到單一可部署模型中。這種訓(xùn)練策略特別強化了長程推理、工具調(diào)用及錯誤恢復(fù)能力,使其更適應(yīng)真實開發(fā)環(huán)境的需求。

基準測試數(shù)據(jù)顯示,當集成SWE-Agent框架時,該模型在SWE-Bench Verified基準上取得超過70%的準確率,在多語言版本及更具挑戰(zhàn)性的Pro版本中仍保持競爭力。值得注意的是,盡管其激活參數(shù)規(guī)模僅為30億,但在TerminalBench 2.0和Aider等智能體評測中,性能表現(xiàn)可與激活參數(shù)量高10-20倍的開源模型媲美,展現(xiàn)出顯著的效率優(yōu)勢。

效率對比圖表進一步證實,在SWE-Bench-Pro任務(wù)中,Qwen3-Coder-Next的3B激活參數(shù)版本已達到行業(yè)領(lǐng)先水平,其性能曲線處于帕累托前沿位置。雖然全注意力架構(gòu)的專有模型在絕對指標上仍占優(yōu)勢,但新模型在低成本智能體部署場景中展現(xiàn)出更強的實用性,特別適合資源受限的開發(fā)環(huán)境。

該模型現(xiàn)已通過ModelScope和Hugging Face平臺開源,開發(fā)團隊表示將持續(xù)優(yōu)化模型的推理決策能力,擴展其任務(wù)支持范圍,并根據(jù)用戶反饋進行快速迭代。此次發(fā)布標志著編程智能體領(lǐng)域在效率優(yōu)化方向取得重要突破,為開發(fā)者提供了更具性價比的選擇。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容