小紅書本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗(yàn)全面升級
  • 首頁 > 企業(yè)IT頻道 > 軟件即服務(wù)

    笑得很好下次別笑了 一鍵變笑臉的GAN技術(shù)入選AAAI2023

    2023年02月14日 17:34:48   來源:中文科技資訊

      表情編輯技術(shù)在特效和修圖場景有著廣泛的應(yīng)用。此前,剪映、醒圖等app上的一鍵變笑臉模板一經(jīng)上線就立刻成為出圈爆款;在抖音上,這一特效還引發(fā)了熱烈的話題討論,「笑得很好下次別笑了」一度登頂抖音話題熱榜。

      近日, 在AI領(lǐng)域的頂級會(huì)議AAAI2023上,來自字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)的3篇關(guān)于表情編輯GAN技術(shù)的論文入選,揭示了上述爆款特效背后的技術(shù)實(shí)現(xiàn)方法。據(jù)了解,AAAI2023共收到了 8,777 有效投稿,最終接受了 1,721 篇論文,總體接受率19.6% 。

    圖片1.png

      ReGANIE: Rectifying GAN Inversion Errors for Accurate Real Image Editing(https://arxiv.org/abs/2301.13402)

      Semantic 3D-aware Portrait Synthesis and Manipulation Based on Compositional Neural Radiance Field(https://arxiv.org/abs/2302.01579)

      CFFT-GAN: Cross-domain Feature Fusion Transformer for Exemplar-based Image Translation

      (https://arxiv.org/abs/2302.01608)

      “一鍵變笑臉”背后的技術(shù)方案:

      第一階段,團(tuán)隊(duì)利用預(yù)訓(xùn)練的3D人臉重建模型,提取3DMM表情系數(shù)并注入到StyleGAN的w空間。同時(shí),渲染出3D shape用作約束條件,訓(xùn)練特定人臉表情的生成。第一階段訓(xùn)練完成就可以生產(chǎn)大量的配對數(shù)據(jù),訓(xùn)練服務(wù)端或移動(dòng)端的pix2pix模型,從而實(shí)現(xiàn)特定表情的編輯。

    圖片4.png

      StyleGAN作為應(yīng)用最廣泛的無條件 GAN 之一,能夠?qū)崿F(xiàn)高保真圖像的生成,同時(shí)也便于在其隱空間內(nèi)進(jìn)行語義編輯。團(tuán)隊(duì)借助StyleGAN自研了人像屬性編輯框架,可以輕易地實(shí)現(xiàn)如人像表情等屬性的編輯效果。詳細(xì)技術(shù)方案見:https://arxiv.org/abs/2109.10737

    圖片5.png

      然而,基于StyleGAN生成的人臉(假圖)和真實(shí)人臉圖像還是有一定的差異,這體現(xiàn)在用假圖訓(xùn)練好的pix2pix模型直接應(yīng)用于自拍特效或者修圖場景會(huì)不可避免的產(chǎn)生一些bad case,因此需要借助StyleGAN反演能力,生產(chǎn)真實(shí)人臉的配對數(shù)據(jù)用于模型訓(xùn)練。

    圖片6.png

      過去,基于StyleGAN的重建和編輯存在trade-off問題,即提升真實(shí)圖像的重建效果會(huì)影響屬性的編輯效果。先前的方法針對性地優(yōu)化了StyleGAN的重建和編輯任務(wù),但沒能從原理上解決上述問題。團(tuán)隊(duì)提出了ReGANIE,通過二階段修復(fù)重建的誤差的方法,在不影響StyleGAN本身編輯能力的同時(shí),大幅地提升了圖像重建的效果,從根本上解決了這個(gè)trade-off問題。

      因此,團(tuán)隊(duì)利用ReGANIE和StyleGAN編輯模型可以生產(chǎn)真實(shí)人像的表情配對數(shù)據(jù),還實(shí)驗(yàn)了如卡通肖像,動(dòng)物肖像等場景擴(kuò)展。

    圖片7.png

      另外,團(tuán)隊(duì)探索了將神經(jīng)輻射場(Nerf)技術(shù)和StyleGAN技術(shù)進(jìn)行結(jié)合,結(jié)合人像分割能力提出了3D一致性的肖像合成與編輯技術(shù)Semantic3D,實(shí)現(xiàn)了肖像數(shù)據(jù)的姿態(tài)和局部可控性。

      它借由視角v的輸入可以靈活生成不同姿態(tài)的肖像圖,從而可以擴(kuò)充訓(xùn)練數(shù)據(jù)的姿態(tài)多樣性。同時(shí),基于組合式生成的思想,讓StyleGAN的隱空間操縱聚焦于期待編輯的屬性,如只編輯面部區(qū)域表情而不改變頭發(fā)或背景。

    圖片8.png

      據(jù)團(tuán)隊(duì)介紹,未來,基于GAN等生成技術(shù)對人像表情進(jìn)行編輯將主要應(yīng)用于短視頻特效、修圖拍攝和內(nèi)容生成等應(yīng)用場景。目前,相關(guān)功能可在抖音,剪影,醒圖等APP體驗(yàn),企業(yè)用戶可登陸火山引擎官網(wǎng)(https://www.volcengine.com/product/emotion-edit)使用表情編輯服務(wù)。

      智能創(chuàng)作團(tuán)隊(duì)是字節(jié)跳動(dòng)AI&多媒體技術(shù)中臺(tái),通過建設(shè)領(lǐng)先的計(jì)算機(jī)視覺、音視頻編輯、特效處理等技術(shù),支持抖音、剪映、頭條等公司內(nèi)眾多產(chǎn)品線;同時(shí)通過火山引擎為外部ToB合作伙伴提供業(yè)界前沿的智能創(chuàng)作能力與行業(yè)解決方案。(作者:黃峰)

      

    [No. X048]
    分享到微信

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。