在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

鄔賀銓:2026年推理算力將占主導(dǎo),智能體驅(qū)動云網(wǎng)算全面升級

   發(fā)布時(shí)間:2026-04-17 21:32 作者:周琳

隨著人工智能與大模型技術(shù)的飛速發(fā)展,智能體正成為科技界和產(chǎn)業(yè)界的焦點(diǎn)。中國工程院院士鄔賀銓指出,到2026年,全球推理算力將占據(jù)AI算力總負(fù)載的70%至80%,而中國的推理需求預(yù)計(jì)將達(dá)到訓(xùn)練需求的8倍。這一趨勢標(biāo)志著算力的應(yīng)用正從訓(xùn)練主導(dǎo)轉(zhuǎn)向推理和智能體主導(dǎo),推動算力架構(gòu)、應(yīng)用場景和商業(yè)模式發(fā)生深刻變革。從單輪生成到多步規(guī)劃,從被動問答到主動任務(wù)執(zhí)行,智能體正在重新定義AI的應(yīng)用邊界。

智能體并非傳統(tǒng)意義上的主機(jī),而是一種基于大模型的能力和資源。單個(gè)智能體通過感知、記憶、規(guī)劃、工具調(diào)用和行動執(zhí)行形成閉環(huán),能夠獨(dú)立完成特定任務(wù)的決策和操作。然而,單一智能體的應(yīng)用邊界和能力上限較為有限,難以處理復(fù)雜目標(biāo)。為突破這一局限,多智能體協(xié)同系統(tǒng)應(yīng)運(yùn)而生。在統(tǒng)一協(xié)調(diào)器的調(diào)度下,相關(guān)智能體可以共享記憶、進(jìn)行高級規(guī)劃和反思,從而涌現(xiàn)出集體智能,處理更復(fù)雜的任務(wù)。

多智能體的規(guī)模化互聯(lián)進(jìn)一步催生了智能體互聯(lián)網(wǎng)(IoA)。與傳統(tǒng)互聯(lián)網(wǎng)實(shí)現(xiàn)主機(jī)和信息互聯(lián)不同,IoA擴(kuò)展為智能體和能力的互聯(lián)。它以IPv6+為基礎(chǔ),疊加新應(yīng)用層協(xié)議,實(shí)現(xiàn)智能體的唯一標(biāo)識、自主發(fā)現(xiàn)、可信交互和協(xié)同執(zhí)行。智能體互聯(lián)網(wǎng)的頂層支撐是智能體即服務(wù)(AaaS),它將智能體和智能體群的能力云化封裝,通過API、SDK和低代碼平臺對外提供服務(wù),支持租戶化、彈性調(diào)度和按需計(jì)費(fèi)。

在面向消費(fèi)者的(To C)領(lǐng)域,智能體主要有三種應(yīng)用模式。第一種是云上APP寄生智能體,它強(qiáng)依賴微信、釘釘?shù)人拗鰽PP,依托云端算力運(yùn)行,斷網(wǎng)后不可用。這類智能體作為APP內(nèi)的AI插件,能夠基于用戶偏好自動完成操作,將聊天工具升級為具備“思考、寫作、讀文件、控設(shè)備”能力的智能助手。第二種是終端OS原生智能體,預(yù)裝于手機(jī)操作系統(tǒng),如中興通訊與字節(jié)跳動聯(lián)合推出的豆包手機(jī)。它采用端云協(xié)同模式,可按用戶意圖調(diào)度APP并自動執(zhí)行業(yè)務(wù)流程,但可能因過度主動而違背用戶臨時(shí)意愿。第三種是本地自治+云端輔助的智能體,如以“龍蝦”為代表的AI私人管家。它不依賴APP,但需手動安裝獨(dú)立PC軟件,決策和權(quán)限管理本地化,通過云上AaaS發(fā)現(xiàn)并協(xié)同其他智能體。

在面向企業(yè)(To B)的領(lǐng)域,智能體的應(yīng)用模式更為多樣。流程自動化智能體通過復(fù)刻人工邏輯,替代生產(chǎn)、運(yùn)維等標(biāo)準(zhǔn)化流程,提升效率。行業(yè)專家智能體依托行業(yè)知識庫和知識圖譜,為企業(yè)提供決策參謀方案。多智能體協(xié)同模式整合供應(yīng)鏈、生產(chǎn)和物流等領(lǐng)域的智能體,實(shí)現(xiàn)跨環(huán)節(jié)協(xié)同。具身智能則支撐工業(yè)機(jī)器人等實(shí)體設(shè)備,完成感知、推理和物理執(zhí)行的閉環(huán)。

智能體的發(fā)展對算力、云和網(wǎng)絡(luò)提出了顛覆性要求。與傳統(tǒng)互聯(lián)網(wǎng)業(yè)務(wù)相比,智能體業(yè)務(wù)的驅(qū)動主體從人工操作變?yōu)闄C(jī)器自主循環(huán),運(yùn)行時(shí)間從晝夜分明變?yōu)?×24小時(shí)不間斷,空間分布從集中式變?yōu)槎帱c(diǎn)網(wǎng)狀調(diào)用。智能體的會話從短對話變?yōu)殚L上下文,流量從平穩(wěn)變?yōu)椤癟oken核爆”式增長,單智能體的Token消耗可達(dá)普通用戶的10至1000倍。

鄔賀銓表示,智能體對算力的需求推動了專用加速器的普及,如GPU和NPU。多智能體需同時(shí)占用多個(gè)隔離的“沙箱/進(jìn)程”,并發(fā)密度激增,對顯存和帶寬提出極高要求。盡管Token流量年增速高達(dá)330%,但通過小模型普及、極致壓縮和長上下文優(yōu)化,未來5年算力增速可控制在41%左右,實(shí)現(xiàn)效率與成本的平衡。

在云服務(wù)領(lǐng)域,智能體時(shí)代要求構(gòu)建智能體原生云,優(yōu)先布局智能體原生架構(gòu),構(gòu)建全局智能調(diào)度,搭建分布式記憶和向量引擎,深化“云—邊—端”協(xié)同。這一趨勢正在重塑中國云服務(wù)格局,AI云全棧服務(wù)迎來爆發(fā),市場向智算融合、綠色低碳和國產(chǎn)深化升級。

網(wǎng)絡(luò)層面,智能體的長會話持續(xù)交互、多智能體協(xié)同通信等特征,使網(wǎng)絡(luò)流量從南北向?yàn)橹鬓D(zhuǎn)為東西向占比80%,QPS提升10至100倍。網(wǎng)絡(luò)架構(gòu)需從行政區(qū)組網(wǎng)轉(zhuǎn)向智算中心—區(qū)域云—邊緣—終端四級架構(gòu),采用SRv6、云網(wǎng)虛擬化與編排技術(shù)、流量AI預(yù)測與調(diào)度等技術(shù),保障確定性與高可靠性。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容