在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

阿里智能引擎團隊突破AI生圖速度極限:2步生成2K高清圖 5秒極速出片

   發(fā)布時間:2026-01-30 21:00 作者:周偉

在AI圖像生成領(lǐng)域,主流擴散模型常因生成速度緩慢而讓用戶感到不便。如今,阿里智能引擎團隊帶來了一項突破性進(jìn)展——他們成功將圖像生成時間大幅縮短,僅需5秒即可產(chǎn)出4張2K高清大圖,徹底顛覆了傳統(tǒng)等待體驗。

該團隊針對Qwen最新開源模型,將原本需要80-100步前向計算的SOTA壓縮技術(shù),直接優(yōu)化至僅需2步完成。這一改進(jìn)使圖像生成效率提升40倍,過去需要近一分鐘才能生成的圖片,如今眨眼間即可呈現(xiàn)。這一成果不僅解決了傳統(tǒng)模型"磨嘰"的痛點,更為實時創(chuàng)作場景提供了技術(shù)支撐。

技術(shù)突破的背后,是團隊對蒸餾方案的深度革新。早期軌跡蒸餾方法存在顯著缺陷:當(dāng)?shù)綌?shù)降低時,生成的圖像會出現(xiàn)模糊、細(xì)節(jié)扭曲等問題,尤其在文字、人物五官等精細(xì)區(qū)域表現(xiàn)不佳。研究發(fā)現(xiàn),這類方法對所有圖像區(qū)域"一視同仁"的約束方式,導(dǎo)致細(xì)節(jié)部分因占比低而學(xué)習(xí)不足。

為突破這一瓶頸,團隊引入基于概率空間的DMD2算法。該方案將約束從樣本空間轉(zhuǎn)移至概率空間,通過Reverse-KL損失函數(shù)設(shè)計,讓模型自主生成圖片后接受教師模型指導(dǎo)。這種"學(xué)生生成-教師指導(dǎo)"的模式,顯著提升了生成圖像的細(xì)節(jié)合理性,成為當(dāng)前擴散步數(shù)蒸餾的主流策略。

面對2步蒸餾場景下的分布退化問題,團隊采用PCM蒸餾進(jìn)行模型熱啟動。實驗數(shù)據(jù)顯示,經(jīng)過熱啟動的模型在形體扭曲問題上改善明顯。通過對比可見,直接使用DMD2訓(xùn)練的模型存在構(gòu)圖不合理現(xiàn)象,而熱啟動后的模型則能生成更自然的圖像結(jié)構(gòu)。

為進(jìn)一步提升細(xì)節(jié)表現(xiàn)力,團隊創(chuàng)新性地將對抗學(xué)習(xí)(GAN)引入訓(xùn)練流程。通過混合高質(zhì)量真實數(shù)據(jù)與教師生成圖、引入DINO特征提取器、調(diào)整損失函數(shù)權(quán)重等優(yōu)化措施,使模型在苔蘚、動物毛發(fā)等復(fù)雜紋理上的生成效果顯著提升。對比實驗表明,增加GAN監(jiān)督后的模型,其畫面質(zhì)感和細(xì)節(jié)層次均達(dá)到新高度。

目前,該團隊的優(yōu)化成果已通過Checkpoint形式在HuggingFace和ModelScope平臺開放下載,同時集成至嗚哩AI平臺供開發(fā)者調(diào)用。這項突破不僅展現(xiàn)了團隊在工程優(yōu)化領(lǐng)域的深厚積累,更體現(xiàn)了其"技術(shù)開放共享"的理念——此前他們已貢獻(xiàn)Havenask、RTP-LLM等多個優(yōu)秀開源項目。

盡管當(dāng)前模型在多數(shù)場景已能媲美原始版本,但在處理復(fù)雜場景時仍存在提升空間。團隊表示將持續(xù)迭代技術(shù),未來計劃推出更多擴散加速方案,并將持續(xù)開源模型權(quán)重。這項突破正在重新定義AI圖像生成的效率標(biāo)準(zhǔn),為創(chuàng)意工作者提供更高效的創(chuàng)作工具。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容