中國(guó)品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國(guó) 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬(wàn)輛,到 2027 年建成萬(wàn)億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開(kāi)發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來(lái)了,阿里云「通義靈碼」全面進(jìn)化,全流程開(kāi)發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來(lái)了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性
  • 首頁(yè) > 企業(yè)IT頻道 > ARVRMR

    微軟專利介紹用機(jī)器學(xué)習(xí)為HoloLens用戶提供完整面部顯示效果

    2021年12月20日 11:07:58   來(lái)源:映維網(wǎng)

      在進(jìn)行視頻通話時(shí),任何頭戴式顯示器系統(tǒng)都必須克服的一個(gè)基本問(wèn)題是:如何呈現(xiàn)用戶的完整面部。挑戰(zhàn)在于,頭顯遮蔽面部,尤其是眼睛;用戶通常是可以移動(dòng);以及用戶不在合適的捕獲設(shè)備的視場(chǎng)范圍內(nèi)。

      在名為“Computing images of head mounted display wearer”的專利申請(qǐng)中,微軟介紹了一種利用機(jī)器學(xué)習(xí)裝置來(lái)計(jì)算補(bǔ)充完整用戶面部圖像的方法和系統(tǒng)。

      圖1是佩戴頭顯102并參與視頻會(huì)議呼叫的人員100的示意圖,其中遠(yuǎn)程方112將所述人員感知成沒(méi)有佩戴頭顯時(shí)的形象。

      在一個(gè)實(shí)現(xiàn)中,圖1中的示例涉及非對(duì)稱頭顯視頻呼叫,其中遠(yuǎn)程方112可以使用傳統(tǒng)顯示器,例如帶有集成網(wǎng)絡(luò)攝像頭的筆記本電腦。遠(yuǎn)程方112從本地用戶接收虛擬網(wǎng)絡(luò)攝像頭流,其中用戶100可以描述為沒(méi)有佩戴頭顯時(shí)的形象,并且其面部表情與用戶100的真實(shí)面部表情匹配。虛擬網(wǎng)絡(luò)攝像頭的視點(diǎn)是根據(jù)用戶偏好預(yù)先配置或設(shè)置。

      在圖1的示例中,存在兩個(gè)額外的面向面部的捕獲設(shè)備,但由于它們被HMD主體遮擋,因此不可見(jiàn)。兩個(gè)附加的面部面向捕獲設(shè)備包括第一眼睛面向捕獲設(shè)備和第二眼睛面向捕獲設(shè)備。第一和第二眼睛面向捕獲設(shè)備可以分別是面向右眼的捕獲設(shè)備和面向左眼的捕獲設(shè)備,并且可以是紅外捕獲設(shè)備。第一和第二眼睛面向捕獲設(shè)備的視場(chǎng)布置成包括眼睛本身、鼻子的一部分以及眼睛周圍的臉頰區(qū)域。

      如圖2所示,在臂架104中,由面向左眼的捕獲設(shè)備捕獲的圖像258、由面向右眼的捕獲設(shè)備捕獲的圖像260和由捕獲設(shè)備捕獲的圖像262都是在同一時(shí)間間隔內(nèi)拍攝。注意,每個(gè)面部捕捉設(shè)備都具有面部的局部視圖,并且無(wú)法獲得面部的完整視圖。

      由于頭顯本身遮擋了佩戴者的大部分面部,因此不可能使用捕獲設(shè)備獲得面部的完整視圖。由于頭顯和佩戴者面部之間的空間很小,因此無(wú)法從頭顯內(nèi)的視角觀察佩戴者的整個(gè)面部,因此有必要進(jìn)行預(yù)測(cè)判斷?捎糜谶M(jìn)行預(yù)測(cè)的觀測(cè)數(shù)據(jù)源包括來(lái)自面部捕捉設(shè)備的經(jīng)驗(yàn)觀測(cè)傳感器數(shù)據(jù)。

      可以發(fā)現(xiàn),使用三個(gè)具有面向面部的捕捉設(shè)備可以獲得特別好的結(jié)果。這是因?yàn)檠劬涂谇粎^(qū)域?qū)τ陬A(yù)測(cè)頭顯用戶的表情非常重要。

      圖3是用于計(jì)算用戶面部圖像的裝置300的示意圖。在某些情況下,圖3的裝置與頭顯集成。在其它情況下,所述裝置遠(yuǎn)離HMD,例如在伴隨計(jì)算設(shè)備中或在云服務(wù)部署中。伴隨計(jì)算設(shè)備是物理上接近頭顯并且與頭顯有線或無(wú)線通信的計(jì)算設(shè)備。伴隨計(jì)算設(shè)備的例子有智能手機(jī)、智能手表和筆記本電腦等

      所述用戶面部圖像計(jì)算裝置包括至少一個(gè)處理器302、存儲(chǔ)器304和顯示控制器306,后者控制頭顯對(duì)一個(gè)或多個(gè)虛擬對(duì)象的顯示。所述裝置進(jìn)一步包括表情系統(tǒng)308,表情系統(tǒng)308將由至少一個(gè)面部捕捉設(shè)備捕捉的傳感器數(shù)據(jù)作為輸入,并計(jì)算表情參數(shù)的輸出值。所述表情系統(tǒng)包括機(jī)器學(xué)習(xí)模型,機(jī)器學(xué)習(xí)模型經(jīng)訓(xùn)練以從輸入圖像計(jì)算表情參數(shù)。照片校準(zhǔn)器310是經(jīng)訓(xùn)練以將從3D面部模型渲染的圖像映射到照片級(jí)真實(shí)感圖像的機(jī)器學(xué)習(xí)模型。

      所述裝置包括具有參數(shù)的三維面部模型312。在一個(gè)實(shí)施例中,3D面部模型312具有標(biāo)識(shí)、表情和姿勢(shì)參數(shù)。標(biāo)識(shí)參數(shù)指定三維人臉模型的實(shí)例化所代表的個(gè)人。表情參數(shù)指定三維人臉模型的形狀和外觀。姿勢(shì)參數(shù)指定三維人臉模型的可移動(dòng)組件的位置和方向,如頜骨、頸部骨骼、眼球、舌頭。姿勢(shì)參數(shù)的值是使用來(lái)自一個(gè)或多個(gè)捕獲設(shè)備的數(shù)據(jù)推斷出來(lái)。

      在某些情況下,眼睛姿勢(shì)和下巴姿勢(shì)是使用眼睛和臂架攝像頭的輸出確定?梢允褂脙H包含表情參數(shù)的三維人臉模型,例如在預(yù)配置姿勢(shì)和標(biāo)識(shí)參數(shù)的位置,或者在不需要移動(dòng)下巴和眼睛的位置。所述裝置同時(shí)包括渲染器314,其用于渲染來(lái)自3D面部模型312的圖像。渲染器是用于渲染來(lái)自3D模型的圖像的任何設(shè)備,例如商用計(jì)算機(jī)圖形渲染器,其使用光線追蹤和關(guān)于虛擬camera的視點(diǎn)的信息來(lái)渲染圖像。

      諸如圖3的表情系統(tǒng)400包括機(jī)器學(xué)習(xí)模型402和優(yōu)化器404。經(jīng)過(guò)訓(xùn)練的機(jī)器學(xué)習(xí)模型是神經(jīng)網(wǎng)絡(luò),或任何其他合適類型的機(jī)器學(xué)習(xí)模型。在一個(gè)示例中,表情系統(tǒng)400的機(jī)器學(xué)習(xí)模型402已經(jīng)使用了描述頭顯用戶面部局部視圖的合成圖像進(jìn)行訓(xùn)練,合成圖像與已知表情參數(shù)相關(guān)。

      在一個(gè)示例中,通過(guò)從參數(shù)化面部模型采樣、將表情應(yīng)用于采樣的參數(shù)化面部模型、添加虛擬頭顯和虛擬照明、從虛擬頭顯中的一個(gè)或多個(gè)面部捕捉設(shè)備的視點(diǎn)渲染來(lái)生成合成圖像。

      在一個(gè)示例中,參數(shù)化面部模型是由多個(gè)單獨(dú)模型形成的復(fù)合模型。各個(gè)模型包括一個(gè)或多個(gè):幾何模型、紋理模型、頭發(fā)模型和眼睛顏色模型。幾何模型基于線性身份和表達(dá)基礎(chǔ),采用線性混合蒙皮控制眼睛、下巴和頭部運(yùn)動(dòng)。為了從幾何模型中采樣,可以使用高斯混合模型。

      紋理模型由反照率紋理和置換紋理組成。反照率紋理表示膚色,而置換表示褶皺和孔隙水平置換。頭發(fā)模型由定義頭發(fā)、眉毛和胡須的各個(gè)發(fā)束的曲線組成。眼睛顏色模型是基于示例的眼睛顏色采樣器。

      可以對(duì)上述各個(gè)模型進(jìn)行單獨(dú)采樣,以獲得可渲染的完整人臉標(biāo)識(shí)。

      面部設(shè)置完成后,將頭顯模型以遮擋感知的方式放置在合成頭部。放置基于平均頭部形狀的手動(dòng)放置,如果設(shè)備與頭部相交,則調(diào)整平均頭部形狀。

      為了模擬面向嘴巴的攝像頭的照明和背景對(duì)象,高動(dòng)態(tài)范圍圖像(HDRI)可用作場(chǎng)景的照明和背景。從庫(kù)中為每個(gè)場(chǎng)景采樣不同的HDRI,并可以選擇每n幀旋轉(zhuǎn)一次HDRI,以模擬頭部旋轉(zhuǎn)和背景運(yùn)動(dòng)。要對(duì)人臉捕捉設(shè)備進(jìn)行建模,需要使用焦距、景深和分辨率來(lái)匹配頭顯真實(shí)人臉捕捉設(shè)備的屬性。

      表情系統(tǒng)的機(jī)器學(xué)習(xí)模型402使用帶損失函數(shù)的監(jiān)督訓(xùn)練進(jìn)行訓(xùn)練,所述損失函數(shù)是訓(xùn)練示例的預(yù)測(cè)表情參數(shù)值和已知表情參數(shù)值之間差異的度量。在一個(gè)例子中,機(jī)器學(xué)習(xí)模型是一個(gè)卷積神經(jīng)網(wǎng)絡(luò),并使用反向傳播進(jìn)行訓(xùn)練。

      在各種示例中,表情系統(tǒng)神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)使得可以從大量不同的用戶群體中以一般方式進(jìn)行訓(xùn)練,然后適應(yīng)具有最少數(shù)據(jù)的個(gè)人。

      照片校準(zhǔn)器412是一種機(jī)器學(xué)習(xí)模型,它將渲染圖像410映射到照片級(jí)真實(shí)感圖像414?梢允褂贸蓪(duì)的數(shù)據(jù)對(duì)光校準(zhǔn)器的機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,每對(duì)數(shù)據(jù)包括從攝像頭捕獲的照片,并描繪具有表情的真實(shí)人員的正面視圖,以及配置與表情對(duì)應(yīng)的參數(shù)值時(shí)從3D人臉模型渲染的圖像。

      圖5是具有中性姿勢(shì)和中性表情的普通人的模板網(wǎng)格500,其中顯示模板網(wǎng)格覆蓋有光滑表面。首先基于個(gè)體的身份對(duì)模板網(wǎng)格500進(jìn)行變形,以創(chuàng)建圖5的502中所示的結(jié)果,結(jié)果是具有中性表情的特定個(gè)體的面部的三維模型。使用基于表情參數(shù)值的第二變形來(lái)變形圖5的502中的結(jié)果,以給出圖5的504中所示的結(jié)果,結(jié)果表示與502中相同的個(gè)體,但具有微笑和閉著眼睛的表情。當(dāng)姿態(tài)參數(shù)的值添加時(shí),結(jié)果顯示在圖5的506中,其中頭部向后傾斜,頭部向右轉(zhuǎn)動(dòng),下巴打開(kāi)。姿勢(shì)參數(shù)設(shè)置眼睛以及頸部和下巴骨骼的姿勢(shì)。

      普通人的模板網(wǎng)格500旨在作為所有人臉的平均值,并有助于將專利所述技術(shù)泛化到不同的個(gè)人。

      圖6是用于計(jì)算頭顯用戶面部圖像的設(shè)備的操作方法的流程圖。簡(jiǎn)單來(lái)說(shuō),首先從至少一個(gè)面向面部的捕獲設(shè)備接收捕獲的輸入圖像,然后再交由機(jī)器學(xué)習(xí)裝置來(lái)計(jì)算補(bǔ)充被輸入圖像中被頭顯遮擋的部分,從而呈現(xiàn)完整的人臉圖像。

      名為“Computing images of head mounted display wearer”的微軟專利申請(qǐng)最初在2020年6月提交,并在日前由美國(guó)專利商標(biāo)局公布。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。