近年來,AI視頻生成技術(shù)正經(jīng)歷著前所未有的變革,從早期的GAN、Transformer架構(gòu)逐步邁向更為先進(jìn)的DiT架構(gòu)。2024年,OpenAI推出的Sora模型驗(yàn)證了Diffusion與Transformer融合路徑的可行性,標(biāo)志著行業(yè)技術(shù)路線逐漸趨于統(tǒng)一。當(dāng)前,短視頻生成在美學(xué)質(zhì)量和多模態(tài)能力上已接近專業(yè)水平,而Sora2、Veo3等模型更是實(shí)現(xiàn)了音畫同步生成,將視頻生成從單純的“畫面工具”升級(jí)為“視聽內(nèi)容引擎”。
在技術(shù)突破的背后,世界模型的發(fā)展同樣引人注目。以Genie 3、Marble為代表的“生成派”模型在2025年后取得實(shí)質(zhì)性進(jìn)展,能夠模擬因果邏輯與動(dòng)態(tài)環(huán)境,并在空間一致性和物理邏輯方面展現(xiàn)出更快的迭代效率。報(bào)告指出,這可能成為突破當(dāng)前技術(shù)瓶頸的關(guān)鍵途徑,但生成時(shí)長(zhǎng)和物理規(guī)律遵循仍是主要限制。預(yù)計(jì)2026年將成為世界建模技術(shù)實(shí)現(xiàn)躍遷的重要節(jié)點(diǎn)。
商業(yè)化方面,AI視頻生成行業(yè)呈現(xiàn)出C端與B端同步推進(jìn)的態(tài)勢(shì)。C端市場(chǎng)以訂閱模式為主,用戶數(shù)量成為關(guān)鍵指標(biāo)。Sora憑借品牌優(yōu)勢(shì)占據(jù)領(lǐng)先地位,其推出的社交化平臺(tái)Sora App為“生成+社交”模式開辟了新路徑。B端市場(chǎng)則以API模式為主,在電商展示和廣告創(chuàng)意等素材級(jí)生成領(lǐng)域已基本成熟。可靈、海螺、Vidu等國產(chǎn)模型在質(zhì)量、效率和成本上達(dá)到行業(yè)領(lǐng)先水平。AI正從素材級(jí)生成向影視級(jí)制作邁進(jìn),海外初創(chuàng)公司Utopai通過提供系統(tǒng)性AI解決方案實(shí)現(xiàn)約1.1億美元收入,OpenAI參與制作的AI影片《Critterz》計(jì)劃于2026年上映,Runway、可靈等廠商也在加速布局,2026年有望成為AI影視制作商業(yè)化的關(guān)鍵起點(diǎn)。
在產(chǎn)業(yè)應(yīng)用層面,傳媒行業(yè)成為“AI+應(yīng)用”的主要陣地,廣告、影視、游戲三大領(lǐng)域深度受益。廣告領(lǐng)域,視頻化趨勢(shì)明顯,豎屏短視頻廣告與當(dāng)前模型能力高度適配,滲透率較低意味著巨大潛力,AI工具可能重塑營(yíng)銷服務(wù)商的價(jià)值鏈。影視領(lǐng)域,AI漫劇憑借效率和成本優(yōu)勢(shì)率先實(shí)現(xiàn)商業(yè)閉環(huán),擬真人短劇內(nèi)容接受度快速提升,逐步進(jìn)入量產(chǎn)階段;長(zhǎng)劇和電影中,CG特效等高價(jià)值環(huán)節(jié)可能成為首批被AI替代的場(chǎng)景,中小型影視團(tuán)隊(duì)有望率先受益。游戲領(lǐng)域,視頻生成與3D生成底層技術(shù)相通,靜態(tài)資產(chǎn)自動(dòng)化生產(chǎn)正從“能力驗(yàn)證”向“實(shí)用落地”邁進(jìn)。長(zhǎng)期來看,世界模型與交互技術(shù)的融合可能催生具備實(shí)時(shí)互動(dòng)能力的新游戲品類,重新定義產(chǎn)業(yè)增長(zhǎng)邊界。
報(bào)告建議重點(diǎn)關(guān)注具備自研算法能力的昆侖萬維,擁有海量版權(quán)資產(chǎn)的中文在線和華策影視,布局AI營(yíng)銷的易點(diǎn)天下,以及推動(dòng)AI嵌入游戲資產(chǎn)生產(chǎn)流程的完美世界和巨人網(wǎng)絡(luò)。這些企業(yè)在技術(shù)儲(chǔ)備、內(nèi)容資源或應(yīng)用場(chǎng)景上具有獨(dú)特優(yōu)勢(shì),可能在未來競(jìng)爭(zhēng)中占據(jù)有利地位。






















