資訊在沃

DeepSeek-V4預覽版上線開源:百萬字上下文,Pro與Flash雙版本齊發

   發布時間:2026-04-24 13:48 作者:朱天宇

DeepSeek 正式發布全新系列模型 DeepSeek-V4 的預覽版本,并同步開源,為人工智能領域帶來新的突破。該模型具備百萬字超長上下文處理能力,在 Agent 能力、世界知識儲備以及推理性能方面均達到國內開源領域的領先水平。

DeepSeek-V4 系列模型分為兩個版本:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。官方介紹,DeepSeek-V4 開創了一種全新的注意力機制,通過在 token 維度進行壓縮,并結合 DSA 稀疏注意力技術,實現了全球領先的長上下文處理能力,同時大幅降低了對計算資源和顯存的需求。從即日起,100 萬上下文將成為 DeepSeek 所有官方服務的標準配置。

在 API 服務方面,DeepSeek 已同步完成更新。用戶只需將 model_name 修改為 deepseek-v4-pro 或 deepseek-v4-flash,即可調用相應版本的模型服務。

DeepSeek-V4-Pro 在 Agent 能力上表現尤為突出。在 Agentic Coding 評測中,該模型已達到當前開源模型的最佳水平,并在其他 Agent 相關評測中同樣取得優異成績。目前,DeepSeek-V4-Pro 已成為公司內部員工使用的 Agentic Coding 模型。據評測反饋,其使用體驗優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但與 Opus 4.6 思考模式仍存在一定差距。

在世界知識測評中,DeepSeek-V4-Pro 的表現同樣亮眼,大幅領先其他開源模型,僅稍遜于頂尖閉源模型 Gemini-Pro-3.1。而在數學、STEM 以及競賽型代碼的測評中,該模型更是超越了所有已公開評測的開源模型,成績可與世界頂級閉源模型媲美。

相比之下,DeepSeek-V4-Flash 在世界知識儲備方面略遜于 Pro 版本,但其推理能力與之接近。由于模型參數和激活量較小,V4-Flash 能夠提供更快捷、經濟的 API 服務,滿足對成本和效率有較高要求的用戶需求。

在 Agent 測評中,DeepSeek-V4-Flash 在簡單任務上的表現與 Pro 版本不相上下,但在處理高難度任務時仍存在一定差距。這一特點使得 V4-Flash 更適合對計算資源有限制或對任務復雜度要求不高的場景。

 
 
更多>同類內容
全站最新
熱門內容