在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

雷軍宣布小米AI研究大放異彩 多篇成果入選ICLR 2026 涵蓋多領(lǐng)域創(chuàng)新

   發(fā)布時間:2026-02-03 12:40 作者:李娜

近日,小米公司在人工智能領(lǐng)域的研究成果引發(fā)廣泛關(guān)注。其團隊有多篇論文成功入選國際頂級會議ICLR 2026,研究范疇覆蓋多模態(tài)推理、強化學(xué)習(xí)、GUI Agent、端到端自動駕駛以及音頻生成等多個前沿方向。ICLR作為人工智能領(lǐng)域極具影響力的學(xué)術(shù)會議,始終致力于推動該領(lǐng)域理論與方法的前沿探索與創(chuàng)新發(fā)展。

在強化學(xué)習(xí)領(lǐng)域,小米團隊提出的《Shuffle-R1》成果頗具創(chuàng)新性。該研究構(gòu)建了數(shù)據(jù)動態(tài)重組框架,核心在于運用成對軌跡采樣和優(yōu)勢值批次重排序兩項關(guān)鍵技術(shù)。這一創(chuàng)新有效解決了多模態(tài)大模型訓(xùn)練過程中存在的優(yōu)勢坍縮與軌跡沉默難題,大幅提升了梯度信號質(zhì)量。在多個基準(zhǔn)測試中,該成果以極低的計算開銷超越了現(xiàn)有的強化學(xué)習(xí)基線水平。

移動智能體方向,小米團隊的《MobileIPL》同樣表現(xiàn)亮眼。團隊首創(chuàng)迭代偏好學(xué)習(xí)框架,借助Thinking-level DPO實現(xiàn)思考步驟的細(xì)粒度優(yōu)化。同時,結(jié)合三階段指令演化機制,成功突破了高質(zhì)量軌跡稀缺這一瓶頸。在AITZ等主流GUI-Agent測試中,該成果刷新了性能紀(jì)錄,并且在分布外場景下展現(xiàn)出更強的魯棒性。

端到端自動駕駛研究方面,小米團隊的《ReCogDrive》實現(xiàn)了技術(shù)融合創(chuàng)新。研究通過分層認(rèn)知數(shù)據(jù)流水線,將駕駛先驗知識注入其中,利用認(rèn)知引導(dǎo)擴散規(guī)劃器生成物理可行的軌跡。還首創(chuàng)DiffGRPO強化學(xué)習(xí)算法,直接對駕駛策略進(jìn)行優(yōu)化。在NAVSIM與Bench2Drive的閉環(huán)測試中,該成果領(lǐng)先于現(xiàn)有方案。

除了上述成果,小米團隊還有其他創(chuàng)新研究?!禩hinkOmni》實現(xiàn)了文本推理能力向全模態(tài)的零成本遷移;《Flow2GAN》融合流匹配與對抗生成技術(shù),實現(xiàn)了高保真少步音頻合成;《WorldSplat》則在4D駕駛場景生成技術(shù)上取得突破。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容