阿里巴巴正式推出其最新研發(fā)的千問旗艦推理模型Qwen3-Max-Thinking,標(biāo)志著國內(nèi)人工智能領(lǐng)域取得重大突破。這款模型在多項(xiàng)國際權(quán)威評測中刷新紀(jì)錄,性能表現(xiàn)已接近國際頂尖水平,成為目前國內(nèi)最強(qiáng)的AI大模型之一。
據(jù)技術(shù)團(tuán)隊(duì)介紹,Qwen3-Max-Thinking總參數(shù)規(guī)模超過萬億級別,預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到36T Tokens,是阿里迄今為止規(guī)模最大、能力最強(qiáng)的推理模型。該模型通過大規(guī)模強(qiáng)化學(xué)習(xí)后訓(xùn)練和多項(xiàng)技術(shù)創(chuàng)新,實(shí)現(xiàn)了性能的顯著提升,在數(shù)學(xué)推理、科學(xué)知識和代碼編程等關(guān)鍵領(lǐng)域展現(xiàn)出卓越能力。
在基準(zhǔn)測試中,這款新模型的表現(xiàn)超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等國際知名模型。特別是在數(shù)學(xué)推理方面,預(yù)覽版已在國內(nèi)首個AIME 25和HMMT 25評測中取得雙滿分成績,正式版通過進(jìn)一步優(yōu)化后,在IMO-AnswerBench等國際數(shù)學(xué)競賽基準(zhǔn)測試中繼續(xù)保持領(lǐng)先。
技術(shù)創(chuàng)新方面,模型引入了自適應(yīng)工具調(diào)用能力和全新的測試時擴(kuò)展機(jī)制。這種機(jī)制不同于傳統(tǒng)推理時簡單增加并行路徑的方式,而是能夠?qū)ν评斫Y(jié)果進(jìn)行"經(jīng)驗(yàn)提取"和自我迭代,在相同上下文中實(shí)現(xiàn)更高效的計算。測試數(shù)據(jù)顯示,該機(jī)制使模型在復(fù)雜推理任務(wù)中的效率提升超過30%。
原生Agent能力是另一大亮點(diǎn)。通過聯(lián)合強(qiáng)化學(xué)習(xí)訓(xùn)練,模型能夠自主選擇搜索、個性化記憶和代碼解釋器等工具,提供專業(yè)水平的回答。技術(shù)團(tuán)隊(duì)表示,這種能力使模型在處理復(fù)雜任務(wù)時更接近人類專家的表現(xiàn),同時將幻覺率降低了40%以上。
應(yīng)用落地方面,阿里已開放多渠道體驗(yàn)。普通用戶可通過PC端和網(wǎng)頁端直接試用,開發(fā)者能在QwenChat平臺免費(fèi)調(diào)用API,企業(yè)用戶則可通過阿里云百煉服務(wù)獲取專業(yè)支持。千問APP也即將完成升級,所有用戶都將能免費(fèi)體驗(yàn)新模型的強(qiáng)大功能。
回顧發(fā)展歷程,阿里Qwen大模型自2022年啟動研發(fā)以來,已成長為全球排名領(lǐng)先的開源項(xiàng)目。此次發(fā)布的Qwen3-Max作為通義千問家族的最新成員,進(jìn)一步鞏固了阿里在基礎(chǔ)模型領(lǐng)域的技術(shù)優(yōu)勢。市場反應(yīng)顯示,消息公布后阿里巴巴港股在次日盤前上漲超過2%,顯示出投資者對這項(xiàng)技術(shù)突破的積極預(yù)期。





















