近期,社交媒體上被各類充滿電影質(zhì)感的AI生成短片刷屏,引發(fā)廣泛關(guān)注。字節(jié)跳動旗下新一代視頻生成大模型Seedance 2.0開啟內(nèi)測后,迅速成為焦點。這款標注“中國自研”的模型不僅在技術(shù)上取得顯著突破,更在國際上引發(fā)關(guān)注,馬斯克在社交平臺X上轉(zhuǎn)發(fā)評論相關(guān)推文,驚嘆其發(fā)展速度之快。
Seedance 2.0的發(fā)布,標志著AI視頻生成技術(shù)從技術(shù)演示邁向?qū)嵱霉ぞ摺?月12日,字節(jié)跳動Seed官方微信公眾號宣布推出該模型。它采用統(tǒng)一的多模態(tài)音視頻聯(lián)合生成架構(gòu),支持文字、圖片、音頻、視頻四種模態(tài)輸入,集成全面的多模態(tài)內(nèi)容參考和編輯能力。與1.5版本相比,生成質(zhì)量、物理準確度、逼真度和可控性均有顯著提升,更貼合工業(yè)級創(chuàng)作場景需求。這一突破解決了AI視頻生成長期存在的可用率低、落地性差的問題,將行業(yè)平均可用率從約20%大幅提升,為商業(yè)化應(yīng)用鋪平道路。
實測數(shù)據(jù)顯示,Seedance 2.0的操作門檻大幅降低。普通用戶只需輸入簡單文字描述,即可快速生成畫面流暢、音畫同步的短視頻;專業(yè)創(chuàng)作者則可通過上傳參考素材,精準控制畫面構(gòu)圖、角色動作和鏡頭語言,甚至能生成多鏡頭連貫劇情短片。這種低門檻、高實用的特性,使其迅速獲得不同圈層用戶的青睞,推動中國自研AI視頻模型首次實現(xiàn)現(xiàn)象級出圈。
作為全球AI視頻生成領(lǐng)域的兩大標桿,Seedance 2.0與OpenAI旗下的Sora在技術(shù)路徑上各有側(cè)重。Sora采用極致算力與數(shù)據(jù)堆疊的實驗室導(dǎo)向路線,擅長超長時長、超高清畫質(zhì)的場景呈現(xiàn),最長可生成1分鐘4K視頻,能還原復(fù)雜物理世界和大規(guī)模人群互動,但目前僅處于實驗室演示階段,未開放商用且成本高昂。Seedance 2.0則采用雙分支擴散變換器架構(gòu),平衡專業(yè)效果、易用性與低成本,最長可生成60秒2K視頻,原生支持廣播級畫質(zhì),可直接適配商用場景。
在核心性能上,兩者各有優(yōu)勢。Seedance 2.0側(cè)重音畫協(xié)同與角色一致性優(yōu)化,支持多語言唇形同步,有效解決多鏡頭創(chuàng)作中角色面部、服飾細節(jié)漂移的問題,更適配商用創(chuàng)作的穩(wěn)定性需求;Sora則在復(fù)雜物理場景還原和長序列敘事連貫性上表現(xiàn)更突出,擅長呈現(xiàn)高難度物理動態(tài)場景。Seedance 2.0在本土化適配和多模態(tài)交互方面更具優(yōu)勢,支持最多9張圖片、3段視頻和3段音頻的混合輸入,創(chuàng)作者可通過“@”符號精準控制每個參考資源的作用,而Sora僅支持圖、文兩種模態(tài)輸入。
AI視頻技術(shù)的快速發(fā)展,引發(fā)對傳統(tǒng)影視崗位是否會被替代的討論。多位行業(yè)專家和從業(yè)者認為,Seedance 2.0等模型帶來的并非顛覆,而是賦能。它們將淘汰低端重復(fù)勞動,但無法替代人類創(chuàng)意與審美判斷。在短視頻領(lǐng)域,Seedance 2.0能大幅提升創(chuàng)作效率,降低制作成本。例如,一部精品真人短劇的制作成本可能高達每分鐘數(shù)萬元,而使用Seedance 2.0生成視頻的算力成本可能低至每分鐘數(shù)百元。這將加速行業(yè)優(yōu)勝劣汰,依賴簡單剪輯、缺乏核心創(chuàng)意的賬號將面臨生存危機,而具備創(chuàng)意能力的創(chuàng)作者和團隊則能借助AI工具實現(xiàn)創(chuàng)意快速落地。
AI視頻技術(shù)的進步也帶來新挑戰(zhàn)。Seedance 2.0最初展示的真人肖像生成能力因高度逼真引發(fā)風險擔憂,字節(jié)跳動已緊急下線上傳真人照片生成視頻的功能。業(yè)內(nèi)人士認為,這一舉措符合法律法規(guī)要求,未來寫實類AI真人短劇可能會改用AI合成真人風格的人物,以平衡創(chuàng)意表達與風險管控。




















