合合信息:破解大模型語料庫難題的引領者核聚變2024北京站高能開幕,ROG電競顯示器強勢助力游戲狂歡華為企業(yè)客戶支持圓桌會議成功舉辦,共筑ICT基礎設施維護新未來66元搶爆款AR眼鏡!京東AR眼鏡超級新品日30天無憂適用等你來攜手共進,智啟未來 —— 華為與CypressTel賽柏特成立 SD-WAN 聯合創(chuàng)新實驗合合信息成功IPO開啟新篇章全球首款第二代酷睿Ultra處理器筆記本!聯想YOGA Air 15 Aura AI元啟版開啟預售中國品牌,讓東南亞感受“消費升級”小紅書本地“坐抖望團”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應商導致 1TB 數據泄露后,迪士尼宣布棄用 Slack 平臺合合信息啟信產業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數字化轉型重慶:力爭今年智能網聯新能源汽車產量突破 100 萬輛,到 2027 年建成萬億級產業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或將停產沖上熱搜!閑魚相關搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網銷量及銷售額領先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%
  • 首頁 > 云計算頻道 > 大模型

    南大提出全新框架VividTalk 一張照片一段聲音秒生超逼真視頻

    2023年12月01日 16:21:06   來源:站長之家

      近日,南大等機構的研究人員推出了一項引人注目的研究成果——VividTalk框架,其能夠通過一段音頻和一張照片實現令人驚嘆的說話視頻生成。這一通用框架采用了兩階段生成方法,首先通過考慮面部運動和blendshape分布之間的映射,利用多分支Transformer網絡建模音頻上下文,生成3D驅動的網格。

      框架的第一階段注重嘴唇運動和面部表情的生成,使用blendshape和頂點偏移作為中間表征,以提供全局粗略的面部表情運動和局部細粒度的嘴唇運動。為了更合理地學習剛性頭部運動,研究人員巧妙地將問題轉化為離散有限空間中的代碼查詢任務,并構建了可學習的頭部姿勢代碼本。這一創(chuàng)新性的方法使得從音頻到頭部姿勢的學習變得更加準確和高效。

      第二階段則在生成器中使用了雙分支motionvae來建模2D密集運動,通過投影紋理表示在2D域中進行運動轉換,提高了網絡性能和生成視頻的質量。VividTalk框架在實驗中取得了顯著的成果,能夠生成具有表情豐富、自然頭部姿勢的口型同步視頻。實驗數據集的豐富性和優(yōu)化的訓練方法使得該框架在生成質量和模型泛化方面表現優(yōu)越。

      這一框架的推出代表了在語音合成領域的一次重要突破。VividTalk不僅支持多語言,而且在生成效果上也勝過了其他同類方法。這項研究成果將有望在虛擬人物、語音合成和視頻制作等領域產生深遠的影響。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相,以敢為精神勇闖技術無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協會聯合上海人工智能實驗室、上海臨港經濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。