在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

京東開源240億參數(shù)JoyAI-Image-Edit,圖像編輯邁入空間智能新紀(jì)元

   發(fā)布時(shí)間:2026-04-12 15:02 作者:周偉

當(dāng)多數(shù)圖像生成工具還在平面修圖的層面徘徊時(shí),京東推出的開源模型JoyAI-Image-Edit已將技術(shù)推向空間智能的新維度。這款模型突破了傳統(tǒng)AI對空間關(guān)系的模糊處理,能夠精準(zhǔn)理解三維場景中的物體位置、遮擋關(guān)系和光影邏輯,為圖像編輯領(lǐng)域帶來革命性變革。

傳統(tǒng)圖像AI在處理空間任務(wù)時(shí)常出現(xiàn)透視錯(cuò)亂、物體漂浮等低級錯(cuò)誤。例如調(diào)整家具位置時(shí),沙發(fā)可能脫離地面;改變拍攝角度時(shí),墻壁會(huì)出現(xiàn)扭曲變形。這些缺陷源于模型缺乏對真實(shí)三維世界的理解,僅能機(jī)械組合像素而無法把握空間邏輯。京東研發(fā)團(tuán)隊(duì)通過將空間智能融入模型底層架構(gòu),使系統(tǒng)能夠像人類一樣感知場景深度和物體關(guān)系。

該模型采用創(chuàng)新性的雙模態(tài)耦合設(shè)計(jì),將80億參數(shù)的多模態(tài)語言模型與160億參數(shù)的擴(kuò)散Transformer深度整合。這種架構(gòu)使空間指令解析與圖像生成形成閉環(huán)——當(dāng)用戶要求"將相機(jī)右移30度"時(shí),系統(tǒng)不僅調(diào)整視角,還會(huì)自動(dòng)修正新視角下的遮擋關(guān)系和光影變化。測試數(shù)據(jù)顯示,在復(fù)雜場景的視角轉(zhuǎn)換任務(wù)中,其生成的圖像空間一致性比同類模型提升47%。

在電商領(lǐng)域,這項(xiàng)技術(shù)展現(xiàn)出巨大應(yīng)用價(jià)值。品牌商可通過單一產(chǎn)品圖自動(dòng)生成數(shù)十種展示視角,無需重新拍攝或人工修圖。某家居品牌實(shí)測顯示,使用該模型后新品上架效率提升3倍,視覺素材成本降低65%。模型支持物體旋轉(zhuǎn)、相機(jī)移動(dòng)等15類編輯操作,能精準(zhǔn)控制每個(gè)物體的空間位置,甚至可生成符合物理規(guī)律的動(dòng)態(tài)序列。

具身智能領(lǐng)域成為另一個(gè)重要應(yīng)用場景。在機(jī)器人訓(xùn)練中,系統(tǒng)可根據(jù)自然語言指令生成海量合成數(shù)據(jù)。當(dāng)要求"機(jī)器人左手舉起"時(shí),模型不僅調(diào)整機(jī)械臂姿態(tài),還會(huì)保持背景環(huán)境合理性,生成符合物理規(guī)則的動(dòng)作序列。這種數(shù)據(jù)生成能力有效解決了機(jī)器人訓(xùn)練的數(shù)據(jù)瓶頸問題,為實(shí)體智能設(shè)備落地提供關(guān)鍵支持。

技術(shù)實(shí)現(xiàn)層面,研發(fā)團(tuán)隊(duì)構(gòu)建了包含空間理解數(shù)據(jù)、長文本渲染數(shù)據(jù)和編輯數(shù)據(jù)的多階段訓(xùn)練體系。通過可擴(kuò)展的數(shù)據(jù)流水線,模型同時(shí)具備空間推理和通用編輯能力。在橫向評測中,其相機(jī)控制精度比主流模型提高32%,物體空間關(guān)系處理準(zhǔn)確率達(dá)91%,特別在復(fù)雜場景的透視保持方面表現(xiàn)突出。

京東選擇Apache 2.0協(xié)議開源該模型,提供完整的推理代碼和模型權(quán)重。開發(fā)者可在GitHub、Hugging Face等平臺(tái)獲取資源,并基于Diffusers格式進(jìn)行二次開發(fā)。這種開放策略使中小團(tuán)隊(duì)也能利用先進(jìn)的空間智能技術(shù),推動(dòng)整個(gè)行業(yè)的技術(shù)普惠。目前已有超過200家企業(yè)申請商用授權(quán),涵蓋電商、設(shè)計(jì)、機(jī)器人等多個(gè)領(lǐng)域。

在AI技術(shù)競爭日益激烈的背景下,京東的差異化路線引人注目。不同于追求參數(shù)規(guī)模的軍備競賽,該公司將技術(shù)扎根于零售、物流等實(shí)體場景,通過解決真實(shí)產(chǎn)業(yè)問題實(shí)現(xiàn)價(jià)值創(chuàng)造。從基礎(chǔ)大模型到數(shù)字人,再到具身智能數(shù)據(jù)中心,其技術(shù)布局始終圍繞供應(yīng)鏈優(yōu)化展開。這種務(wù)實(shí)策略或許預(yù)示著AI發(fā)展的新方向——讓技術(shù)回歸服務(wù)實(shí)體經(jīng)濟(jì)的本質(zhì)。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容