南大提出全新框架VividTalk 一張照片一段聲音秒生超逼真視頻

2023年12月01日 16:21:06 來源：站長之家

　　近日，南大等機構的研究人員推出了一項引人注目的研究成果——VividTalk框架，其能夠通過一段音頻和一張照片實現令人驚嘆的說話視頻生成。這一通用框架采用了兩階段生成方法，首先通過考慮面部運動和blendshape分布之間的映射，利用多分支Transformer網絡建模音頻上下文，生成3D驅動的網格。

　　框架的第一階段注重嘴唇運動和面部表情的生成，使用blendshape和頂點偏移作為中間表征，以提供全局粗略的面部表情運動和局部細粒度的嘴唇運動。為了更合理地學習剛性頭部運動，研究人員巧妙地將問題轉化為離散有限空間中的代碼查詢任務，并構建了可學習的頭部姿勢代碼本。這一創(chuàng)新性的方法使得從音頻到頭部姿勢的學習變得更加準確和高效。

　　第二階段則在生成器中使用了雙分支motionvae來建模2D密集運動，通過投影紋理表示在2D域中進行運動轉換，提高了網絡性能和生成視頻的質量。VividTalk框架在實驗中取得了顯著的成果，能夠生成具有表情豐富、自然頭部姿勢的口型同步視頻。實驗數據集的豐富性和優(yōu)化的訓練方法使得該框架在生成質量和模型泛化方面表現優(yōu)越。

　　這一框架的推出代表了在語音合成領域的一次重要突破。VividTalk不僅支持多語言，而且在生成效果上也勝過了其他同類方法。這項研究成果將有望在虛擬人物、語音合成和視頻制作等領域產生深遠的影響。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

[No. ]
分享到微信

即時

TCL實業(yè)榮獲IFA2024多項大獎，展示全球科技創(chuàng)新力量

近日，德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產品設計及應用方面的創(chuàng)新變革，全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產品設計創(chuàng)新大獎”金獎，有力證明了其在全球市場的強大影響力。

服貿會高通展示開放創(chuàng)新生態(tài)，以5G、AI等技術促進合作共贏

OPPO續(xù)約歐洲冠軍聯賽未來三季再續(xù)輝煌

新聞

敢闖技術無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

近日，中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相，以敢為精神勇闖技術無人區(qū)，斬獲四項AWE 2024艾普蘭大獎。

企業(yè)IT

重慶創(chuàng)新公積金應用，“區(qū)塊鏈+政務服務”顯成效

“以前都要去窗口辦，一套流程下來都要半個月了，現在方便多了!”打開“重慶公積金”微信小程序，按照提示流程提交相關材料，僅幾秒鐘，重慶市民曾某的賬戶就打進了21600元。

3C消費

“純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

2024年3月12日，由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

研究

2024全球開發(fā)者先鋒大會即將開幕

由世界人工智能大會組委會、上海市經信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導，由上海市人工智能行業(yè)協會聯合上海人工智能實驗室、上海臨港經濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”，將于2024年3月23日至24日舉辦。

專題

2021 CCF全國高性能計算學術年會

返回主頁 ┊ 關于我們 ┊ 內容聯系 ┊ 聯系我們 ┊ 免責聲明 ┊ 原創(chuàng)新聞 ┊ 友情鏈接 ┊ 舊版首頁

感谢您访问我们的网站，您可能还对以下资源感兴趣：
台湾中文娱乐网
久久精品视频国产女人扒开腿让人桶视频男女做爰猛烈叫床视频免费 99精品久久久中文字幕欧美日韩一区精品视频

南大提出全新框架VividTalk 一張照片一段聲音秒生超逼真視頻

擴展閱讀