在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

阿里發(fā)布萬億參數(shù)千問旗艦推理模型Qwen3-Max-Thinking 性能效率雙提升

   發(fā)布時間:2026-01-27 21:01 作者:吳俊

阿里巴巴正式推出其最新研發(fā)的千問旗艦推理模型Qwen3-Max-Thinking,標志著該公司在人工智能領域又邁出重要一步。這款模型擁有超過萬億參數(shù),預訓練數(shù)據(jù)量達到36T Tokens,成為阿里迄今為止規(guī)模最大、性能最強的推理模型。

開發(fā)者現(xiàn)在可以通過QwenChat平臺免費體驗Qwen3-Max-Thinking模型,企業(yè)用戶則可通過阿里云百煉平臺獲取該模型的API服務。普通用戶也能在千問PC端和網(wǎng)頁端試用這一強大模型,千問APP也即將完成新模型的接入,屆時所有用戶均可免費體驗其卓越性能。

在性能方面,Qwen3-Max-Thinking表現(xiàn)尤為突出。預覽版模型已在數(shù)學推理AIME 25和HMMT 25測試中斬獲國內(nèi)首個雙滿分,展現(xiàn)了驚人的推理能力。經(jīng)過更大規(guī)模的強化學習后訓練,正式版模型的性能得到全面提升,特別是在推理效率方面實現(xiàn)了重大突破。

該模型采用了一種創(chuàng)新的測試時擴展(Test-time Scaling)機制,能夠從之前的推理結果中提取"經(jīng)驗"并進行多輪自我迭代。這種機制避免了傳統(tǒng)推理計算中常見的冗余推導,在相同上下文中實現(xiàn)了更高效的推理計算,從而獲得更智能的推理結果。基于這一技術創(chuàng)新,千問在"人類最后的測試"HLE中取得58.3分的優(yōu)異成績,遠超GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,創(chuàng)下當前所有模型的最高分。

面向即將到來的智能體Agent時代,Qwen3-Max-Thinking還顯著增強了自主調(diào)用工具的原生Agent能力。這一改進使模型能夠更自主地完成復雜任務,為未來智能應用的發(fā)展奠定了堅實基礎。

在太空應用領域,千問大模型也取得了突破性進展。2025年11月,國星宇航成功將千問Qwen3大模型部署至"星算"計劃01組太空計算中心,這是全球首次實現(xiàn)在軌運行的衛(wèi)星上部署通用大模型。該模型在太空中成功執(zhí)行多次端到端推理任務,從地面上傳問題到衛(wèi)星,由大模型完成在軌推理,再將結果數(shù)據(jù)回傳地面,整個過程耗時不到2分鐘。

在開源社區(qū)方面,千問系列模型同樣表現(xiàn)亮眼。全球最大AI開源社區(qū)Hugging Face最新數(shù)據(jù)顯示,阿里千問衍生模型數(shù)量已突破20萬個,成為全球首個達成此目標的開源大模型。同時,千問系列模型下載量突破10億次,平均每天被下載110萬次,下載量已全面超越美國Llama模型,穩(wěn)居開源大模型全球第一的位置。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容