文心5.0正式版上線：原生全模態(tài)突破，多領(lǐng)域能力領(lǐng)先國際梯隊-資訊-沃資訊

文心5.0正式版上線：原生全模態(tài)突破，多領(lǐng)域能力領(lǐng)先國際梯隊

發(fā)布時間：2026-01-23 03:06 來源：快訊作者：吳婷

百度正式推出其原生全模態(tài)大模型文心5.0，標(biāo)志著中國在多模態(tài)人工智能領(lǐng)域邁出重要一步。這款模型擁有2.4萬億參數(shù)，通過原生全模態(tài)統(tǒng)一建模技術(shù)，實現(xiàn)了對文本、圖像、音頻和視頻等多種信息形式的深度理解與生成。用戶現(xiàn)已可通過文心APP、文心一言官網(wǎng)以及百度千帆平臺體驗或調(diào)用該模型。

在權(quán)威基準(zhǔn)測試中，文心5.0展現(xiàn)出卓越性能。其語言與多模態(tài)理解能力超越Gemini-2.5-Pro、GPT-5-High等國際主流模型，穩(wěn)居全球第一梯隊。圖像與視頻生成能力則與垂直領(lǐng)域?qū)I(yè)模型不相上下，整體技術(shù)處于世界領(lǐng)先水平。特別是在多模態(tài)任務(wù)處理上，該模型通過統(tǒng)一的自回歸架構(gòu)實現(xiàn)多源數(shù)據(jù)聯(lián)合訓(xùn)練，使文本、圖像、視頻和音頻特征在統(tǒng)一框架下深度融合。

技術(shù)架構(gòu)方面，文心5.0采用超大規(guī)模混合專家結(jié)構(gòu)，激活參數(shù)比低于3%，在保持強大性能的同時顯著提升推理效率。通過大規(guī)模工具環(huán)境合成任務(wù)軌跡數(shù)據(jù)，并結(jié)合思維鏈與行動鏈的端到端強化學(xué)習(xí)訓(xùn)練，模型在智能體交互和工具調(diào)用能力上取得突破性進展。這些創(chuàng)新使其能夠自動解析視頻內(nèi)容并生成可執(zhí)行代碼，甚至模擬《紅樓夢》中王熙鳳的文風(fēng)創(chuàng)作商業(yè)方案。

在同期舉辦的文心MOMENT大會上，百度展示了該模型的實際應(yīng)用案例。輸入一段復(fù)刻"活了么"App的教學(xué)視頻后，系統(tǒng)不僅精準(zhǔn)拆解操作步驟，更自動生成完整的前端代碼。在創(chuàng)意寫作任務(wù)中，模型成功融合古典文學(xué)語境與現(xiàn)代商業(yè)邏輯，輸出兼具文學(xué)價值與實用性的"大觀園資產(chǎn)重組方案"，充分展現(xiàn)其情境理解與跨領(lǐng)域創(chuàng)作能力。

為持續(xù)提升模型專業(yè)度，百度同步推進"文心導(dǎo)師"計劃。目前已有835位來自科技、金融、醫(yī)療等十余個重點行業(yè)的專家加入指導(dǎo)團隊，在知識體系構(gòu)建、專業(yè)內(nèi)容校準(zhǔn)和價值觀對齊等方面提供支持。這種產(chǎn)學(xué)研協(xié)同模式有效增強了模型在邏輯嚴(yán)謹性、專業(yè)深度和創(chuàng)意質(zhì)量等維度的表現(xiàn)。

回顧發(fā)展歷程，文心5.0系列模型自2025年11月發(fā)布Preview版本以來，持續(xù)在國際競技場保持領(lǐng)先。在LMArena全球大模型評測中，該系列多次包攬國內(nèi)文本與視覺理解榜單首位，1月15日更以1460分刷新紀(jì)錄，位列全球文本榜第八，超越GPT-5.1-High等國際頂尖模型。這些成就彰顯了中國在多模態(tài)大模型底層技術(shù)創(chuàng)新方面的實力，為全球AI產(chǎn)業(yè)競爭格局帶來新變量。

更多>同類內(nèi)容