阿里發(fā)布千問旗艦推理模型Qwen3-Max-Thinking：多項(xiàng)性能刷新全球紀(jì)錄-游戲-沃資訊

阿里發(fā)布千問旗艦推理模型Qwen3-Max-Thinking：多項(xiàng)性能刷新全球紀(jì)錄

發(fā)布時間：2026-01-28 00:02 來源：快訊作者：趙磊

阿里巴巴正式推出其最新研發(fā)的千問旗艦推理模型Qwen3-Max-Thinking，標(biāo)志著國內(nèi)人工智能領(lǐng)域取得重大突破。這款模型在多項(xiàng)國際權(quán)威評測中刷新紀(jì)錄，性能表現(xiàn)已接近國際頂尖水平，成為目前國內(nèi)最強(qiáng)的AI大模型之一。

據(jù)技術(shù)團(tuán)隊(duì)介紹，Qwen3-Max-Thinking總參數(shù)規(guī)模超過萬億級別，預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到36T Tokens，是阿里迄今為止規(guī)模最大、能力最強(qiáng)的推理模型。該模型通過大規(guī)模強(qiáng)化學(xué)習(xí)后訓(xùn)練和多項(xiàng)技術(shù)創(chuàng)新，實(shí)現(xiàn)了性能的顯著提升，在數(shù)學(xué)推理、科學(xué)知識和代碼編程等關(guān)鍵領(lǐng)域展現(xiàn)出卓越能力。

在基準(zhǔn)測試中，這款新模型的表現(xiàn)超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等國際知名模型。特別是在數(shù)學(xué)推理方面，預(yù)覽版已在國內(nèi)首個AIME 25和HMMT 25評測中取得雙滿分成績，正式版通過進(jìn)一步優(yōu)化后，在IMO-AnswerBench等國際數(shù)學(xué)競賽基準(zhǔn)測試中繼續(xù)保持領(lǐng)先。

技術(shù)創(chuàng)新方面，模型引入了自適應(yīng)工具調(diào)用能力和全新的測試時擴(kuò)展機(jī)制。這種機(jī)制不同于傳統(tǒng)推理時簡單增加并行路徑的方式，而是能夠?qū)ν评斫Y(jié)果進(jìn)行"經(jīng)驗(yàn)提取"和自我迭代，在相同上下文中實(shí)現(xiàn)更高效的計算。測試數(shù)據(jù)顯示，該機(jī)制使模型在復(fù)雜推理任務(wù)中的效率提升超過30%。

原生Agent能力是另一大亮點(diǎn)。通過聯(lián)合強(qiáng)化學(xué)習(xí)訓(xùn)練，模型能夠自主選擇搜索、個性化記憶和代碼解釋器等工具，提供專業(yè)水平的回答。技術(shù)團(tuán)隊(duì)表示，這種能力使模型在處理復(fù)雜任務(wù)時更接近人類專家的表現(xiàn)，同時將幻覺率降低了40%以上。

應(yīng)用落地方面，阿里已開放多渠道體驗(yàn)。普通用戶可通過PC端和網(wǎng)頁端直接試用，開發(fā)者能在QwenChat平臺免費(fèi)調(diào)用API，企業(yè)用戶則可通過阿里云百煉服務(wù)獲取專業(yè)支持。千問APP也即將完成升級，所有用戶都將能免費(fèi)體驗(yàn)新模型的強(qiáng)大功能。

回顧發(fā)展歷程，阿里Qwen大模型自2022年啟動研發(fā)以來，已成長為全球排名領(lǐng)先的開源項(xiàng)目。此次發(fā)布的Qwen3-Max作為通義千問家族的最新成員，進(jìn)一步鞏固了阿里在基礎(chǔ)模型領(lǐng)域的技術(shù)優(yōu)勢。市場反應(yīng)顯示，消息公布后阿里巴巴港股在次日盤前上漲超過2%，顯示出投資者對這項(xiàng)技術(shù)突破的積極預(yù)期。

更多>同類內(nèi)容