百度正式推出其原生全模態(tài)大模型文心5.0,標(biāo)志著中國在多模態(tài)人工智能領(lǐng)域邁出重要一步。這款模型擁有2.4萬億參數(shù),通過原生全模態(tài)統(tǒng)一建模技術(shù),實現(xiàn)了對文本、圖像、音頻和視頻等多種信息形式的深度理解與生成。用戶現(xiàn)已可通過文心APP、文心一言官網(wǎng)以及百度千帆平臺體驗或調(diào)用該模型。
在權(quán)威基準(zhǔn)測試中,文心5.0展現(xiàn)出卓越性能。其語言與多模態(tài)理解能力超越Gemini-2.5-Pro、GPT-5-High等國際主流模型,穩(wěn)居全球第一梯隊。圖像與視頻生成能力則與垂直領(lǐng)域?qū)I(yè)模型不相上下,整體技術(shù)處于世界領(lǐng)先水平。特別是在多模態(tài)任務(wù)處理上,該模型通過統(tǒng)一的自回歸架構(gòu)實現(xiàn)多源數(shù)據(jù)聯(lián)合訓(xùn)練,使文本、圖像、視頻和音頻特征在統(tǒng)一框架下深度融合。
技術(shù)架構(gòu)方面,文心5.0采用超大規(guī)模混合專家結(jié)構(gòu),激活參數(shù)比低于3%,在保持強大性能的同時顯著提升推理效率。通過大規(guī)模工具環(huán)境合成任務(wù)軌跡數(shù)據(jù),并結(jié)合思維鏈與行動鏈的端到端強化學(xué)習(xí)訓(xùn)練,模型在智能體交互和工具調(diào)用能力上取得突破性進展。這些創(chuàng)新使其能夠自動解析視頻內(nèi)容并生成可執(zhí)行代碼,甚至模擬《紅樓夢》中王熙鳳的文風(fēng)創(chuàng)作商業(yè)方案。
在同期舉辦的文心MOMENT大會上,百度展示了該模型的實際應(yīng)用案例。輸入一段復(fù)刻"活了么"App的教學(xué)視頻后,系統(tǒng)不僅精準(zhǔn)拆解操作步驟,更自動生成完整的前端代碼。在創(chuàng)意寫作任務(wù)中,模型成功融合古典文學(xué)語境與現(xiàn)代商業(yè)邏輯,輸出兼具文學(xué)價值與實用性的"大觀園資產(chǎn)重組方案",充分展現(xiàn)其情境理解與跨領(lǐng)域創(chuàng)作能力。
為持續(xù)提升模型專業(yè)度,百度同步推進"文心導(dǎo)師"計劃。目前已有835位來自科技、金融、醫(yī)療等十余個重點行業(yè)的專家加入指導(dǎo)團隊,在知識體系構(gòu)建、專業(yè)內(nèi)容校準(zhǔn)和價值觀對齊等方面提供支持。這種產(chǎn)學(xué)研協(xié)同模式有效增強了模型在邏輯嚴(yán)謹性、專業(yè)深度和創(chuàng)意質(zhì)量等維度的表現(xiàn)。
回顧發(fā)展歷程,文心5.0系列模型自2025年11月發(fā)布Preview版本以來,持續(xù)在國際競技場保持領(lǐng)先。在LMArena全球大模型評測中,該系列多次包攬國內(nèi)文本與視覺理解榜單首位,1月15日更以1460分刷新紀(jì)錄,位列全球文本榜第八,超越GPT-5.1-High等國際頂尖模型。這些成就彰顯了中國在多模態(tài)大模型底層技術(shù)創(chuàng)新方面的實力,為全球AI產(chǎn)業(yè)競爭格局帶來新變量。





















