在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

阿里發(fā)布Qwen3-Max-Thinking:超萬億參數(shù)刷新紀(jì)錄,推理性能與Agent能力雙飛躍

   發(fā)布時(shí)間:2026-01-27 20:06 作者:沈如風(fēng)

阿里云正式推出其迄今為止規(guī)模最大、性能最強(qiáng)的千問系列推理模型——Qwen3-Max-Thinking。該模型總參數(shù)量突破萬億級(jí),預(yù)訓(xùn)練數(shù)據(jù)規(guī)模達(dá)36T Tokens,在多項(xiàng)核心指標(biāo)上實(shí)現(xiàn)全球領(lǐng)先,標(biāo)志著國產(chǎn)大模型技術(shù)邁入新階段。

在性能突破方面,Qwen3-Max-Thinking通過參數(shù)規(guī)模擴(kuò)展與強(qiáng)化學(xué)習(xí)優(yōu)化,在19項(xiàng)國際權(quán)威基準(zhǔn)測試中刷新紀(jì)錄。該模型不僅在數(shù)學(xué)推理領(lǐng)域斬獲AIME 25和HMMT 25國內(nèi)首個(gè)雙滿分,更在復(fù)雜推理、指令遵循、人類偏好對(duì)齊等維度達(dá)到國際頂尖水平。特別是在啟用工具的"人類最后測試"(HLE)中,以58.3分超越GPT-5.2-Thinking(45.5分)和Gemini 3 Pro(45.8分),創(chuàng)下當(dāng)前所有模型最高分。

技術(shù)架構(gòu)創(chuàng)新方面,模型引入全新測試時(shí)擴(kuò)展機(jī)制,通過"經(jīng)驗(yàn)提煉-自我迭代"的推理范式,顯著提升計(jì)算效率。傳統(tǒng)推理路徑常出現(xiàn)重復(fù)推導(dǎo)現(xiàn)象,而新機(jī)制可對(duì)歷史推理結(jié)果進(jìn)行結(jié)構(gòu)化提煉,在相同上下文窗口內(nèi)實(shí)現(xiàn)多輪智能迭代。這種突破使模型在保持高性能的同時(shí),推理成本降低30%以上,為大規(guī)模商業(yè)化應(yīng)用奠定基礎(chǔ)。

針對(duì)智能體(Agent)應(yīng)用場景,模型特別強(qiáng)化了原生工具調(diào)用能力。在QwenChat交互界面中,用戶可直觀體驗(yàn)?zāi)P妥灾鬟x擇搜索、個(gè)性化記憶、代碼解釋器等核心工具的能力。通過規(guī)則獎(jiǎng)勵(lì)與模型獎(jiǎng)勵(lì)聯(lián)合訓(xùn)練體系,模型能根據(jù)任務(wù)需求智能組合工具使用策略,回答準(zhǔn)確率提升40%,幻覺問題減少25%,在專業(yè)領(lǐng)域表現(xiàn)接近人類專家水平。

開發(fā)者可通過QwenChat平臺(tái)免費(fèi)體驗(yàn)?zāi)P湍芰Γ髽I(yè)用戶可登陸阿里云百煉平臺(tái)獲取API服務(wù)。千問官方APP即將完成模型接入升級(jí),屆時(shí)所有用戶均可通過PC端、網(wǎng)頁端及移動(dòng)端免費(fèi)使用。目前平臺(tái)已開放數(shù)學(xué)推理、代碼生成、多輪對(duì)話等場景的測試接口,支持中文、英文等多語言交互。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容