在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

國產(chǎn)算力突破“卡脖子”難關(guān):從萬卡到十萬卡的三重挑戰(zhàn)與破局之路

   發(fā)布時間:2026-03-21 10:16 作者:楊凌霄

近日,中科曙光在鄭州宣布其全自研的scaleFabric高速網(wǎng)絡(luò)產(chǎn)品正式發(fā)布,并成功在國家超算互聯(lián)網(wǎng)核心節(jié)點(diǎn)部署了全國產(chǎn)化的萬卡級智算集群。這一突破標(biāo)志著國產(chǎn)算力基礎(chǔ)設(shè)施在關(guān)鍵技術(shù)領(lǐng)域邁出了重要一步,為應(yīng)對國際競爭提供了新的支撐。

當(dāng)前,國產(chǎn)算力集群正面臨從萬卡向十萬卡規(guī)??缭降奶魬?zhàn)。中國科學(xué)院計算技術(shù)研究所專家王展指出,中科曙光此次實現(xiàn)的萬卡集群是全國首個全棧國產(chǎn)化方案,涵蓋CPU、GPU、交換機(jī)芯片及網(wǎng)卡芯片。相比之下,國際巨頭英偉達(dá)已通過CUDA生態(tài)和InfiniBand(IB)網(wǎng)絡(luò)技術(shù)構(gòu)建了十萬卡級集群,并在持續(xù)擴(kuò)大規(guī)模。這種差距不僅體現(xiàn)在數(shù)字上,更反映了技術(shù)、生態(tài)和系統(tǒng)工程的全面挑戰(zhàn)。

長期以來,IB網(wǎng)絡(luò)技術(shù)被英偉達(dá)壟斷。該公司通過收購邁絡(luò)思掌握了核心技術(shù),形成難以突破的技術(shù)壁壘,制約了國內(nèi)算力產(chǎn)業(yè)向超大規(guī)模發(fā)展。中科曙光高級副總裁李斌表示,從萬卡到十萬卡的核心挑戰(zhàn)不在于計算節(jié)點(diǎn)本身,而在于互聯(lián)系統(tǒng)。當(dāng)集群規(guī)模呈數(shù)量級增長時,計算效率的可擴(kuò)展性和超高可靠性成為關(guān)鍵難題。

據(jù)行業(yè)調(diào)查,到2025年底全球智算基礎(chǔ)設(shè)施投資規(guī)模將持續(xù)擴(kuò)大,支撐下一代萬億參數(shù)大模型需要八萬到十萬卡規(guī)模的集群。奇異摩爾聯(lián)合創(chuàng)始人??|從技術(shù)角度分析,超大規(guī)模集群對交換機(jī)帶寬和存儲容量提出極高要求,同時端側(cè)網(wǎng)卡和協(xié)議層面面臨更大挑戰(zhàn)。傳統(tǒng)基于IB或RoCEv2的協(xié)議在萬卡以上規(guī)模會變?yōu)?有損網(wǎng)絡(luò)",引發(fā)丟包處理、擁塞管理等連鎖問題。

北京科技大學(xué)儲根深教授的實踐印證了軟硬件協(xié)同的重要性。其團(tuán)隊通過GPU顯存直接互聯(lián)技術(shù)優(yōu)化通信路徑,使萬卡規(guī)模下某些軟件的通信開銷從50%降至10%。這表明硬件能力必須通過軟件棧深度適配才能轉(zhuǎn)化為實際性能。李斌強(qiáng)調(diào),超大規(guī)模集群需要網(wǎng)絡(luò)側(cè)、計算側(cè)、供電系統(tǒng)及上層控制系統(tǒng)的整體協(xié)同,并與應(yīng)用算法和分布式訓(xùn)練流程深度耦合。

實現(xiàn)十萬卡集群面臨三大核心挑戰(zhàn):大規(guī)??煽啃?、與算法流程的深度協(xié)同、系統(tǒng)級調(diào)優(yōu)門檻。曙光信息產(chǎn)業(yè)副總裁李柳指出,可靠性是十萬卡集群的生命線,故障恢復(fù)時間隨規(guī)模擴(kuò)大呈指數(shù)級增長。scaleFabric采用基于信用的流控機(jī)制和鏈路故障快速恢復(fù)技術(shù),將恢復(fù)時間降至毫秒級,并通過長期穩(wěn)定性測試驗證其可靠性。

在技術(shù)路線選擇上,國產(chǎn)算力面臨IB與以太網(wǎng)RoCE的分野。中科曙光選擇兼容IB生態(tài)的路線,認(rèn)為其無損網(wǎng)絡(luò)特性對RDMA性能至關(guān)重要。但部分行業(yè)專家指出,全球多數(shù)智算中心仍基于RoCE技術(shù),且互聯(lián)網(wǎng)企業(yè)已形成成熟的以太網(wǎng)架構(gòu)體系。這種分歧源于用戶背景差異:超算從業(yè)者傾向IB體系,而智算領(lǐng)域以互聯(lián)網(wǎng)企業(yè)為主,更熟悉以太網(wǎng)。

這種技術(shù)路線分歧帶來市場雙軌并存的格局。李斌表示,中科曙光支持國內(nèi)不同算力芯片的適配,同時需應(yīng)對增量部署的兼容性挑戰(zhàn)。王展指出,全新國產(chǎn)集群可實現(xiàn)應(yīng)用無縫遷移,但若用戶想保留原有英偉達(dá)IB交換機(jī),可能因私有協(xié)議限制導(dǎo)致通信障礙。這凸顯了掌握自主核心技術(shù)的必要性。

國產(chǎn)算力正探索差異化發(fā)展路徑。??|認(rèn)為,美國采取"暴力堆算力"策略,而中國通過提升算力效率、降低成本推動AI普惠。在軟件層面,國產(chǎn)廠商通過精細(xì)化優(yōu)化挖掘硬件潛力;在架構(gòu)層面,存算一體、重構(gòu)計算等新型架構(gòu)為突破海外限制提供新可能。這種發(fā)展模式依托電力優(yōu)勢和互聯(lián)技術(shù)追趕,有望實現(xiàn)"以系統(tǒng)優(yōu)勢彌補(bǔ)單點(diǎn)差異"的高質(zhì)量發(fā)展。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容