在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

阿里發(fā)布Qwen3-Max-Thinking模型,性能比肩國際頂尖,推理能力創(chuàng)新高

   發(fā)布時(shí)間:2026-01-27 12:01 作者:周琳

阿里正式推出其最新旗艦推理模型——千問Qwen3-Max-Thinking,該模型在多項(xiàng)權(quán)威評測中刷新全球紀(jì)錄,成為國內(nèi)最接近國際頂尖水平的AI大模型,性能表現(xiàn)可與GPT-5.2和Gemini 3 Pro相媲美。

作為阿里規(guī)模最大、能力最強(qiáng)的千問推理模型,Qwen3-Max-Thinking擁有超過萬億參數(shù),并基于36T Tokens的預(yù)訓(xùn)練數(shù)據(jù)構(gòu)建。通過極致擴(kuò)展總參數(shù)、強(qiáng)化學(xué)習(xí)及推理計(jì)算規(guī)模,新模型在科學(xué)知識、數(shù)學(xué)推理和代碼編程等關(guān)鍵性能基準(zhǔn)測試中取得突破性進(jìn)展,刷新多項(xiàng)全球紀(jì)錄。

在推理能力提升方面,千問團(tuán)隊(duì)創(chuàng)新性地引入測試時(shí)擴(kuò)展(Test-time Scaling)機(jī)制。該機(jī)制突破傳統(tǒng)推理計(jì)算中簡單增加并行路徑的局限,通過“經(jīng)驗(yàn)提取”方式對過往推理結(jié)果進(jìn)行提煉,實(shí)現(xiàn)多輪自我迭代。這一設(shè)計(jì)使模型在相同上下文中完成更高效的推理計(jì)算,顯著提升性能與效率。例如,在“人類最后的測試”(HLE)中,Qwen3-Max-Thinking以58.3分的成績超越GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,創(chuàng)下當(dāng)前所有模型的最高分。

面向智能體(Agent)時(shí)代需求,Qwen3-Max-Thinking進(jìn)一步強(qiáng)化了自主調(diào)用工具的原生Agent能力。通義團(tuán)隊(duì)在完成初步工具使用微調(diào)后,通過規(guī)則獎(jiǎng)勵(lì)與模型獎(jiǎng)勵(lì)聯(lián)合強(qiáng)化學(xué)習(xí)訓(xùn)練,使模型具備智能結(jié)合工具進(jìn)行思考的能力。在QwenChat平臺上,用戶可體驗(yàn)?zāi)P妥灾髡{(diào)用搜索、個(gè)性化記憶和代碼解釋器等核心Agent工具,獲得專業(yè)級回答。這種自適應(yīng)工具調(diào)用機(jī)制不僅提升了回答的智能性與流暢度,還大幅降低模型幻覺,為解決復(fù)雜任務(wù)提供可靠支持。

目前,開發(fā)者可通過QwenChat平臺免費(fèi)體驗(yàn)Qwen3-Max-Thinking模型,企業(yè)用戶可通過阿里云百煉獲取API服務(wù),普通用戶則可通過千問PC端和網(wǎng)頁端直接試用。千問App即將完成新模型接入,屆時(shí)所有用戶均可免費(fèi)體驗(yàn)這一國內(nèi)最強(qiáng)AI大模型的強(qiáng)大能力。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容