日韩欧美一区二区在线,色婷婷综合久久久久中国一区二区

阿里千問(wèn)Qwen3-Coder-Next發(fā)布：低推理成本賦能高效編程智能體新突破

發(fā)布時(shí)間：2026-02-04 09:06 來(lái)源：快訊作者：趙磊

阿里巴巴千問(wèn)團(tuán)隊(duì)近日正式發(fā)布了一款面向編碼代理與本地開(kāi)發(fā)場(chǎng)景的開(kāi)放權(quán)重語(yǔ)言模型——Qwen3-Coder-Next。該模型通過(guò)創(chuàng)新架構(gòu)與訓(xùn)練方法，在編程能力與推理效率之間實(shí)現(xiàn)了突破性平衡，為開(kāi)發(fā)者提供了更高效的智能編程工具。

基于Qwen3-Next-80B-A3B-Base架構(gòu)，研發(fā)團(tuán)隊(duì)采用混合注意力機(jī)制與MoE（專家混合）架構(gòu)，構(gòu)建了新一代智能編程模型。通過(guò)大規(guī)?？蓤?zhí)行任務(wù)合成、環(huán)境交互反饋與強(qiáng)化學(xué)習(xí)技術(shù)，模型在降低推理成本的同時(shí)，顯著提升了代碼生成與智能體交互能力。訓(xùn)練過(guò)程中突破傳統(tǒng)參數(shù)擴(kuò)展模式，重點(diǎn)強(qiáng)化智能體訓(xùn)練信號(hào)的擴(kuò)展性，采用四階段優(yōu)化策略：首先在代碼與智能體數(shù)據(jù)集上進(jìn)行持續(xù)預(yù)訓(xùn)練，隨后通過(guò)高質(zhì)量智能體軌跡數(shù)據(jù)監(jiān)督微調(diào)，接著針對(duì)軟件工程、QA、Web/UX等領(lǐng)域開(kāi)展專家訓(xùn)練，最終將多領(lǐng)域能力蒸餾至單一可部署模型。

在編程智能體基準(zhǔn)測(cè)試中，該模型展現(xiàn)出強(qiáng)勁競(jìng)爭(zhēng)力。使用SWE-Agent框架時(shí)，在SWE-Bench Verified基準(zhǔn)上取得超過(guò)70%的準(zhǔn)確率，在多語(yǔ)言環(huán)境及更具挑戰(zhàn)性的SWE-Bench-Pro測(cè)試中保持領(lǐng)先。特別值得注意的是，盡管激活參數(shù)規(guī)模僅為3B，其性能已可媲美參數(shù)量高10-20倍的開(kāi)源模型，在TerminalBench 2.0和Aider等基準(zhǔn)測(cè)試中同樣表現(xiàn)優(yōu)異。

效率與性能的平衡優(yōu)化成為該模型的核心優(yōu)勢(shì)。測(cè)試數(shù)據(jù)顯示，在SWE-Bench-Pro基準(zhǔn)上，3B激活參數(shù)的Qwen3-Coder-Next與參數(shù)量大數(shù)十倍的模型性能相當(dāng)，在低成本智能體部署場(chǎng)景中占據(jù)帕累托前沿。這種突破得益于訓(xùn)練方法對(duì)長(zhǎng)程推理、工具使用和錯(cuò)誤恢復(fù)能力的針對(duì)性強(qiáng)化，使模型更適應(yīng)真實(shí)開(kāi)發(fā)環(huán)境中的復(fù)雜需求。

目前，該模型已通過(guò)ModelScope和Hugging Face平臺(tái)開(kāi)放下載，開(kāi)發(fā)者可自由獲取模型權(quán)重進(jìn)行本地部署與二次開(kāi)發(fā)。研發(fā)團(tuán)隊(duì)表示，后續(xù)將持續(xù)優(yōu)化模型的推理決策能力，擴(kuò)展任務(wù)支持范圍，并根據(jù)用戶反饋快速迭代更新，為智能編程領(lǐng)域提供更強(qiáng)大的技術(shù)支撐。

更多>同類內(nèi)容