中國(guó)品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國(guó) 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性
  • 首頁 > 信息融合頻道 > 人工智能

    業(yè)界首次! 云天勵(lì)飛提出用遞歸網(wǎng)絡(luò)模型解決視頻人臉關(guān)鍵點(diǎn)定位問題

    2019年02月21日 21:25:10   來源:中文科技資訊

      云天勵(lì)飛人工智能技術(shù)研究多項(xiàng)成果再獲國(guó)際認(rèn)可。近日,將于今年4月在日本舉行的人工智能領(lǐng)域一大頂級(jí)學(xué)術(shù)會(huì)議——人工智能及統(tǒng)計(jì)學(xué)大會(huì)(International Conference on Artificial Intelligence and Statistics,簡(jiǎn)稱AISTATS會(huì)議)收錄結(jié)果揭曉,云天勵(lì)飛AI技術(shù)部王孝宇博士與美國(guó)愛荷華大學(xué)楊天寶教授領(lǐng)導(dǎo)的團(tuán)隊(duì)合作的論文《A Robust Zero-Sum Game Framework for Pool-based Active Learning》入選。該論文提出了一種基于穩(wěn)健優(yōu)化的博弈主動(dòng)學(xué)習(xí)算法,這有助于節(jié)省多種監(jiān)督學(xué)習(xí)的標(biāo)注成本。而在不久前,云天勵(lì)飛另一篇有關(guān)采用遞歸網(wǎng)絡(luò)模型解決視頻人臉關(guān)鍵點(diǎn)定位的論文被計(jì)算機(jī)視覺頂級(jí)學(xué)術(shù)期刊IJCV收錄。8WX中文科技資訊

      用遞歸神經(jīng)網(wǎng)絡(luò) 為人臉關(guān)鍵點(diǎn)檢測(cè)建立時(shí)間和空間聯(lián)系8WX中文科技資訊

      云天勵(lì)飛被IJCV 2018收錄的論文名為《RED-Net: A Recurrent Encoder-Decoder Network for Video-based Face Alignment》,團(tuán)隊(duì)在業(yè)界首次提出采用遞歸網(wǎng)絡(luò)模型解決視頻人臉關(guān)鍵點(diǎn)定位問題,以此來減少訓(xùn)練模型的復(fù)雜度,并實(shí)現(xiàn)對(duì)大姿態(tài)人臉和部分遮擋關(guān)鍵點(diǎn)的精確定位。此項(xiàng)工作的參與成員還包括IBM Watson研究院和新澤西州立大學(xué)。8WX中文科技資訊

    18WX中文科技資訊

      Overview of the recurrent encoder-decoder network: (a) encoder-decoder (Section 3.1); (b) spatial recurrent learning (Section 3.2); (c) temporal recurrent learning (Section 3.3); and (d) supervised identity disentangling (Section 3.4). fenc, fdec, fsr n, ft r n, fc l s are potentially nonlinear and multi-layered mappings8WX中文科技資訊

      據(jù)悉,傳統(tǒng)視頻人臉關(guān)鍵點(diǎn)檢測(cè)通常使用級(jí)聯(lián)化的的關(guān)鍵點(diǎn)坐標(biāo)回歸模型對(duì)關(guān)鍵點(diǎn)進(jìn)行由粗到細(xì)的定位。在進(jìn)行視頻逐幀人臉關(guān)鍵點(diǎn)定位時(shí),通過使用上一幀人臉的檢測(cè)框和關(guān)鍵點(diǎn)信息對(duì)該幀的定位任務(wù)進(jìn)行更精確的初始化。這類級(jí)聯(lián)回歸模型不同級(jí)間并不共享參數(shù),模型訓(xùn)練對(duì)數(shù)據(jù)量的要求較高。8WX中文科技資訊

    28WX中文科技資訊

      An unrolled illustration of spatial recurrent learning. The response map is pretty coarse when the initial guess is far away from the ground truth if large pose and expression exist. It eventually gets refined in the successive recurrent steps8WX中文科技資訊

      云天勵(lì)飛團(tuán)隊(duì)等在論文中提出了一種新的遞歸編碼解碼器(Recurrent Decoder-Encoder)模型結(jié)構(gòu)來解決視頻人臉關(guān)鍵點(diǎn)定位問題。在空間域上,該模型變傳統(tǒng)多級(jí)級(jí)聯(lián)模型為單一遞歸模型,大幅度減少模型的復(fù)雜度。在時(shí)間域上,該模型將編碼器生成的嵌入特征中的時(shí)變因素和時(shí)不變因素進(jìn)行解耦,并對(duì)時(shí)變部分用遞歸網(wǎng)絡(luò)進(jìn)行建模學(xué)習(xí)。8WX中文科技資訊

    38WX中文科技資訊

      An unrolled illustration of temporal recurrent learning. Cid encodes temporalinvariant factor which subjects to the same identity constraint. Cpe encodes temporalvariant factors which is further modeled in ft R N N8WX中文科技資訊

      相比傳統(tǒng)視頻人臉關(guān)鍵點(diǎn)處理中只使用上一幀結(jié)果初始化,這種時(shí)域遞歸網(wǎng)絡(luò)能夠?qū)W習(xí)和利用更長(zhǎng)時(shí)間范圍內(nèi)關(guān)鍵點(diǎn)的位置信息和變化規(guī)律,實(shí)現(xiàn)對(duì)大姿態(tài)人臉和部分遮擋關(guān)鍵點(diǎn)實(shí)現(xiàn)精確定位。8WX中文科技資訊

      據(jù)介紹,與國(guó)際主流方法相比較,在7關(guān)鍵點(diǎn)和68關(guān)鍵點(diǎn)兩種模式下,采用遞歸網(wǎng)絡(luò)模型定位視頻人臉關(guān)鍵點(diǎn)的方法,在Talking Face, Face Moive 和 300VW 三個(gè)公開數(shù)據(jù)集平均誤差都顯著低于這些主流方法。8WX中文科技資訊

    遞歸圖8WX中文科技資訊

      將模型訓(xùn)練和標(biāo)注選取結(jié)合 提升模型訓(xùn)練效果8WX中文科技資訊

      大數(shù)據(jù)時(shí)代來臨,人工智能領(lǐng)域面臨的一大難題是如何獲取監(jiān)督學(xué)習(xí)所需要的大數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)標(biāo)注。對(duì)于監(jiān)督學(xué)習(xí)來說,并不是每個(gè)標(biāo)注數(shù)據(jù)對(duì)模型訓(xùn)練的幫助程度都是等同的,即有些數(shù)據(jù)對(duì)模型訓(xùn)練幫助更大。而主動(dòng)學(xué)習(xí)則是研究如何選取潛在對(duì)模型訓(xùn)練更大的未標(biāo)注數(shù)據(jù)去給予它們標(biāo)注,從而達(dá)到提升模型訓(xùn)練效果、節(jié)省人工標(biāo)注成本的目的。8WX中文科技資訊

      不過,目前已存在的主動(dòng)學(xué)習(xí)算法大多或是基于分類模型產(chǎn)生的數(shù)據(jù)不確定性并利用一些啟發(fā)式策略進(jìn)行標(biāo)注數(shù)據(jù)選取;或是利用其它理論如信息理論、學(xué)習(xí)理論定義數(shù)據(jù)不確定性并產(chǎn)生一些優(yōu)化式策略進(jìn)行標(biāo)注數(shù)據(jù)選取。8WX中文科技資訊

      分開進(jìn)行標(biāo)注數(shù)據(jù)選取和模型訓(xùn)練可能會(huì)存在二者步調(diào)不統(tǒng)一的情況,從而無法得最優(yōu)的結(jié)果!禔 Robust Zero-Sum Game Framework for Pool-based Active Learning》提出的思路并不像之前其它算法那樣把模型訓(xùn)練和標(biāo)注選取兩個(gè)模塊割裂開來,而是利用博弈論將其結(jié)合在一起,并引入穩(wěn)健約束進(jìn)行優(yōu)化,以獲得最直接的標(biāo)注數(shù)據(jù)選取,以及模型訓(xùn)練效果的提升。8WX中文科技資訊

      作者基于博弈論提出的優(yōu)化目標(biāo)函數(shù)如下:8WX中文科技資訊

    8WX中文科技資訊

      其中w代表模型參數(shù),如支持向量機(jī)(SVM),深度神經(jīng)網(wǎng)絡(luò)(DNN)等;p為單個(gè)數(shù)據(jù)產(chǎn)生的損失的權(quán)重(由于是主動(dòng)學(xué)習(xí)場(chǎng)景,考慮到存在未標(biāo)注數(shù)據(jù),作者使用的是對(duì)于所有可能標(biāo)注的期望損失8WX中文科技資訊

      作者采取在線梯度下降(online gradient descent)更新模型參數(shù)w:8WX中文科技資訊

    8WX中文科技資訊

      作者采取鏡像下降(mirror descent)更新數(shù)據(jù)損失權(quán)重p:8WX中文科技資訊

    8WX中文科技資訊

      由于加入了穩(wěn)健約束,作者利用近似映射的方法矯正p:8WX中文科技資訊

    8WX中文科技資訊

      對(duì)于方差小的數(shù)據(jù),加入穩(wěn)健約束可以獲得更好的模型泛化效果:8WX中文科技資訊

    8WX中文科技資訊

      當(dāng)數(shù)據(jù)方差數(shù)量級(jí)小于1/n時(shí),泛化錯(cuò)誤將為O(1/n)而不是通常的O(1/sqrt(n)).8WX中文科技資訊

      此外,作者運(yùn)用了在線算法的分析思路證明了算法收斂的遺憾界限(regret bound):8WX中文科技資訊

    8WX中文科技資訊

    8WX中文科技資訊

      最后,作者進(jìn)行了對(duì)于SVM和DNN的主動(dòng)學(xué)習(xí)實(shí)驗(yàn),并采用了一些知名機(jī)器學(xué)習(xí)算法效果對(duì)比數(shù)據(jù)集(benchmark datasets),效果如下 (橫軸為標(biāo)注數(shù)據(jù)數(shù)目,縱軸為測(cè)試準(zhǔn)確度,RZSG為論文提出的算法):8WX中文科技資訊

    評(píng)分18WX中文科技資訊

    8WX中文科技資訊

    8WX中文科技資訊

    8WX中文科技資訊

    評(píng)分38WX中文科技資訊

      MNIST8WX中文科技資訊

    評(píng)分48WX中文科技資訊

      CIFAR 108WX中文科技資訊

    評(píng)分58WX中文科技資訊

      來源:XXX(非中文科技資訊)的作品均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載請(qǐng)尊重版權(quán)保留出處,一切法律責(zé)任自負(fù)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

      如發(fā)現(xiàn)本站文章存在問題,提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至news@citnews.com.cn。

    [上傳用戶: S039]
    分享到微信

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。