在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

蔡浩宇新加坡再出發(fā):LPM 1.0突破AI視頻局限,開啟虛擬角色交互新紀(jì)元

   發(fā)布時(shí)間:2026-04-14 15:38 作者:沈如風(fēng)

在AI視頻生成領(lǐng)域,一場(chǎng)關(guān)于“表演”的革命正悄然展開。當(dāng)行業(yè)還在為提升畫面質(zhì)量而激烈競(jìng)爭(zhēng)時(shí),Anuttacon公司推出的LPM 1.0模型卻另辟蹊徑,將焦點(diǎn)轉(zhuǎn)向了虛擬角色的交互能力與生命感,為AI視頻生成開辟了新的賽道。

長(zhǎng)久以來(lái),AI視頻生成領(lǐng)域一直面臨著一個(gè)棘手的難題——“表演三難困境”。這一困境指的是在表現(xiàn)質(zhì)量、實(shí)時(shí)推理和長(zhǎng)程穩(wěn)定性這三個(gè)方面難以同時(shí)達(dá)到理想狀態(tài)。現(xiàn)有的模型雖然在短視頻生成上表現(xiàn)出色,但一旦涉及長(zhǎng)時(shí)間、實(shí)時(shí)的交互需求,便會(huì)暴露出諸多問題,如角色臉部特征驟變、身份不一致或動(dòng)作不合理等。這些問題使得AI視頻生成在更廣泛的應(yīng)用場(chǎng)景中受到限制。

然而,LPM 1.0的出現(xiàn)打破了這一僵局。該模型實(shí)現(xiàn)了真正意義上的“無(wú)限時(shí)長(zhǎng)”視頻生成,在官網(wǎng)上展示的45分鐘視頻demo令人驚嘆。這一突破并非單純依靠堆砌算力,而是得益于其獨(dú)特的在線流式生成架構(gòu)。通過分布匹配蒸餾的四階段訓(xùn)練方式,LPM模型將一個(gè)170億參數(shù)的大型擴(kuò)散模型壓縮成了“主干 - 精煉器”結(jié)構(gòu)。主干網(wǎng)絡(luò)負(fù)責(zé)穩(wěn)定視頻的粗略軌跡,精煉器則專注于還原高保真的表情細(xì)節(jié)。這種設(shè)計(jì)使得模型在內(nèi)存占用恒定的情況下,能夠維持近乎永恒的身份一致性。

除了無(wú)限時(shí)長(zhǎng)的生成能力,LPM 1.0在交互性方面也有著顯著的創(chuàng)新。它首次實(shí)現(xiàn)了全雙工的音視頻對(duì)話,能夠同時(shí)處理兩路音頻流。一路是AI自身的話語(yǔ),用于驅(qū)動(dòng)口型同步;另一路是用戶的話語(yǔ),用于驅(qū)動(dòng)實(shí)時(shí)反應(yīng)。這使得AI能夠根據(jù)用戶的語(yǔ)氣和停頓,像人類一樣產(chǎn)生點(diǎn)頭、挑眉等微表情,大大增強(qiáng)了虛擬角色的生命感和真實(shí)感。

Anuttacon公司的背后,站著米哈游的前任董事長(zhǎng)蔡浩宇。作為米哈游的第一大股東,蔡浩宇將米哈游在游戲開發(fā)中積累的豐富經(jīng)驗(yàn)帶到了AI領(lǐng)域。米哈游的核心壁壘在于將“人類表演學(xué)”進(jìn)行了數(shù)字工業(yè)化的解構(gòu),這種獨(dú)特的基因在LPM 1.0中得到了充分體現(xiàn)。例如,該模型的“身份感知參考圖像管線”不僅需要一張照片,還需要全局外觀、多視角圖像甚至是8類預(yù)定義的表情范例。相比于從海量無(wú)標(biāo)注視頻中提取特征,Anuttacon能夠提供高度結(jié)構(gòu)化的“表演邏輯”數(shù)據(jù),如78種精細(xì)情感和超過5000個(gè)動(dòng)作描述符。這種對(duì)美感和角色塑造的經(jīng)驗(yàn)積累和極高品控標(biāo)準(zhǔn),是通用短視頻平臺(tái)難以企及的。

在商業(yè)策略上,Anuttacon選擇了完全不開源LPM 1.0模型。這一決策符合商業(yè)理性,因?yàn)樵撃P筒粌H是一套算法,更是一套完整的視覺引擎,在AI視頻生成的虛擬角色細(xì)分領(lǐng)域具有巨大的商業(yè)價(jià)值。然而,實(shí)時(shí)生成視頻對(duì)算力的消耗巨大,即使LPM經(jīng)過了極致的優(yōu)化,能在單GPU約0.35秒處理1秒的視頻,但在大規(guī)模并發(fā)的實(shí)際應(yīng)用場(chǎng)景中,硬件成本和運(yùn)維壓力依然不容小覷。

從應(yīng)用場(chǎng)景來(lái)看,LPM的底層能力更適合對(duì)穩(wěn)定性要求嚴(yán)苛的B端場(chǎng)景。虛擬主播、AI導(dǎo)師、客服等常見場(chǎng)景對(duì)長(zhǎng)時(shí)間穩(wěn)定性有剛需,LPM驅(qū)動(dòng)的AI角色能夠7天24小時(shí)運(yùn)行,且無(wú)需昂貴的動(dòng)捕設(shè)備成本,綜合成本極具競(jìng)爭(zhēng)力。若將LPM作為構(gòu)建UGC平臺(tái)的基礎(chǔ)設(shè)施,還能降低內(nèi)容創(chuàng)作的專業(yè)門檻,用戶只需提供一張照片和一段話,AI即可完成所有的表演,為全新的互動(dòng)媒體形式的誕生創(chuàng)造了條件。

LPM 1.0的出現(xiàn),標(biāo)志著AI視頻生成領(lǐng)域進(jìn)入了一個(gè)新的階段。它不再局限于追求畫面的逼真度,而是更加注重虛擬角色的交互能力和生命感。在這場(chǎng)關(guān)于“表演”的革命中,Anuttacon公司已經(jīng)搶占了先機(jī),而蔡浩宇的商業(yè)布局也正逐漸展現(xiàn)出其深遠(yuǎn)的影響。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容