合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬(wàn)輛,到 2027 年建成萬(wàn)億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來(lái)了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來(lái)了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購(gòu)物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測(cè)試版現(xiàn)已開放革命性AI對(duì)話系統(tǒng)Moshi問(wèn)世:機(jī)器也能說(shuō)人話了?
  • 首頁(yè) > 企業(yè)IT頻道 > ARVRMR

    微軟專利為AR/VR身體姿態(tài)捕捉提出預(yù)測(cè)鉸接對(duì)象姿態(tài)技術(shù)

    2023年09月18日 15:04:49   來(lái)源:映維網(wǎng)

      使用虛擬表示準(zhǔn)確地表示人類用戶的真實(shí)世界姿態(tài)通常需要關(guān)于用戶身體部位的位置/方向的相對(duì)詳細(xì)的信息,而這種信息并不總是可用。例如,當(dāng)頭戴式設(shè)備用于提供虛擬現(xiàn)實(shí)體驗(yàn)時(shí),系統(tǒng)可能僅接收與用戶頭部和可選手有關(guān)的空間信息。在大多數(shù)情況下,這不足以準(zhǔn)確地重現(xiàn)人類用戶的真實(shí)姿態(tài)。

      所以在名為“Pose prediction for articulated object”的專利申請(qǐng)中,微軟提出了一種預(yù)測(cè)鉸接對(duì)象的姿態(tài)的技術(shù)。特別地,機(jī)器學(xué)習(xí)模型接收到鉸接對(duì)象的n個(gè)不同關(guān)節(jié)的空間信息,其中n個(gè)關(guān)節(jié)小于鉸接對(duì)象的所有關(guān)節(jié)。

      例如在人類用戶的情況下,n個(gè)關(guān)節(jié)可以包括人類用戶的頭部關(guān)節(jié)和/或一個(gè)或兩個(gè)手腕關(guān)節(jié),它們與詳細(xì)說(shuō)明用戶頭部和/或手的參數(shù)的空間信息相關(guān)聯(lián)。

      機(jī)器學(xué)習(xí)模型已訓(xùn)練為接收鉸接對(duì)象的n+m個(gè)關(guān)節(jié)的輸入空間信息,其中m大于等于1。例如,在初始訓(xùn)練期間,機(jī)器學(xué)習(xí)模型會(huì)接收到與鉸接對(duì)象的幾乎所有關(guān)節(jié)相對(duì)應(yīng)的輸入數(shù)據(jù)。所述n+m個(gè)關(guān)節(jié)可包括所鉸接對(duì)象的每一個(gè)關(guān)節(jié)。

      但在其他示例中,n+m個(gè)關(guān)節(jié)可包括少于鉸接對(duì)象的所有關(guān)節(jié)。在訓(xùn)練過(guò)程中,提供給機(jī)器學(xué)習(xí)模型的輸入數(shù)據(jù)可能會(huì)逐漸被屏蔽。 m個(gè)節(jié)點(diǎn)中的特定節(jié)點(diǎn)對(duì)應(yīng)的輸入數(shù)據(jù)可以用表示掩碼節(jié)點(diǎn)的預(yù)定義值替換,或者干脆省略。

      換句話說(shuō),機(jī)器學(xué)習(xí)模型訓(xùn)練成基于關(guān)于鉸接對(duì)象的各種可移動(dòng)部分的位置/方向的逐漸減少的信息來(lái)準(zhǔn)確預(yù)測(cè)鉸接對(duì)象的姿態(tài)。

      通過(guò)這種方式,機(jī)器學(xué)習(xí)模型可以基于稀疏輸入在運(yùn)行時(shí)準(zhǔn)確地預(yù)測(cè)鉸接對(duì)象的姿態(tài)。微軟指出,這種技術(shù)可以有益地允許對(duì)諸如人類用戶的鉸接對(duì)象的真實(shí)世界姿態(tài)的精確再現(xiàn),而不需要關(guān)于鉸接對(duì)象的每個(gè)關(guān)節(jié)的方向的廣泛信息。

      換句話說(shuō),發(fā)明可以通過(guò)更準(zhǔn)確地再現(xiàn)人類用戶的真實(shí)世界姿勢(shì)來(lái)提供改進(jìn)人機(jī)交互的技術(shù)優(yōu)勢(shì),例如提高虛擬現(xiàn)實(shí)體驗(yàn)的沉浸感,和/或提高手勢(shì)識(shí)別系統(tǒng)的準(zhǔn)確性。

      另外,所述技術(shù)可以通過(guò)減少必須作為姿態(tài)預(yù)測(cè)過(guò)程的輸入而收集的數(shù)據(jù)量,從而在準(zhǔn)確地重現(xiàn)人類用戶的真實(shí)姿態(tài)的同時(shí)減少計(jì)算資源的消耗。

      圖2示出用于預(yù)測(cè)鉸接對(duì)象的姿態(tài)的示例方法200。

      在202處,接收鉸接對(duì)象的n個(gè)關(guān)節(jié)的空間信息。系統(tǒng)接收到鉸接對(duì)象的n個(gè)關(guān)節(jié)的空間信息,其中包含的關(guān)節(jié)少于鉸接對(duì)象的所有關(guān)節(jié)。將關(guān)節(jié)的空間信息表示為所連接的身體部分的六自由度位置和方向,這可用于推斷關(guān)節(jié)的狀態(tài)。

      作為一個(gè)示例,所述n個(gè)關(guān)節(jié)可包括人體的頭部關(guān)節(jié),所述頭部關(guān)節(jié)的空間信息可詳細(xì)描述人體頭部的參數(shù)。另外,所述n個(gè)關(guān)節(jié)可包括人體的一個(gè)或多個(gè)腕關(guān)節(jié),所述一個(gè)或多個(gè)腕關(guān)節(jié)的空間信息可詳細(xì)描述人體的一只或多只手的參數(shù)。

      圖3顯示了人類用戶。人類用戶有一個(gè)頭300和兩只手302A和302B。計(jì)算系統(tǒng)可以接收人類用戶的一個(gè)或多個(gè)關(guān)節(jié)的空間信息,其可以包括頭部和/或手腕關(guān)節(jié)。

      所述鉸接對(duì)象的n個(gè)關(guān)節(jié)的空間信息可由一個(gè)或多個(gè)傳感器輸出的定位數(shù)據(jù)導(dǎo)出。傳感器可以集成到一個(gè)或多個(gè)由人類用戶的相應(yīng)身體部位持有或佩戴的設(shè)備之中。

      例如,傳感器可以包括一個(gè)或多個(gè)集成到頭戴式顯示設(shè)備和/或手持控制器中的慣性測(cè)量單元。作為另一個(gè)例子,傳感器可以包括一個(gè)或多個(gè)攝像頭。

      圖3示意性地說(shuō)明了不同類型的傳感器,其中來(lái)自傳感器的輸出可以包括或可用于導(dǎo)出空間信息。具體地,人類用戶在其頭部300佩戴頭戴式顯示設(shè)備304。

      另外,人類用戶手持位置傳感器306A和306B,所述位置傳感器可配置為檢測(cè)并向頭顯 304和/或配置為接收空間信息的另一計(jì)算系統(tǒng)報(bào)告用戶手部的運(yùn)動(dòng)。

      回到圖2,在204中,將n個(gè)關(guān)節(jié)的空間信息傳遞給先前訓(xùn)練過(guò)的機(jī)器學(xué)習(xí)模型,模型接收n+m個(gè)關(guān)節(jié)的空間信息作為輸入,其中m>=1。換句話說(shuō),機(jī)器學(xué)習(xí)模型接收的關(guān)節(jié)的空間信息比之前訓(xùn)練的機(jī)器學(xué)習(xí)模型接收的關(guān)節(jié)要少。

      在206中,從機(jī)器學(xué)習(xí)模型接收作為輸出的關(guān)節(jié)對(duì)象的姿態(tài)預(yù)測(cè),所述預(yù)測(cè)至少基于n個(gè)關(guān)節(jié)的空間信息,并且不包含它們的關(guān)節(jié)的空間信息。換句話說(shuō),即便沒有提供m個(gè)關(guān)節(jié)的空間信息,機(jī)器學(xué)習(xí)模型都可以預(yù)測(cè)關(guān)節(jié)對(duì)象的完整姿態(tài)。

      這個(gè)過(guò)程如圖4所示,圖4顯示了一個(gè)示例機(jī)器學(xué)習(xí)模型400。

      在圖4中,機(jī)器學(xué)習(xí)模型接收到空間信息402,對(duì)應(yīng)三個(gè)不同的關(guān)節(jié)J1、J2、J3。關(guān)節(jié)的空間信息可以采用任何合適的計(jì)算機(jī)數(shù)據(jù)的形式,而所述數(shù)據(jù)指定或可用于導(dǎo)出與關(guān)節(jié)相連的身體部位的位置和/或方向。

      例如,空間信息可以直接指定身體部位的位置和方向,和/或空間信息可以指定關(guān)節(jié)相對(duì)于一個(gè)或多個(gè)旋轉(zhuǎn)軸的一個(gè)或多個(gè)旋轉(zhuǎn)。在圖4中,關(guān)節(jié)J1、J2、J3對(duì)應(yīng)于人類用戶的頭部關(guān)節(jié)404A和兩個(gè)手腕關(guān)節(jié)404B/404C,如圖用戶身體上疊加的陰影圓圈所示。

      在本例中,n個(gè)關(guān)節(jié)包括三個(gè)關(guān)節(jié),分別對(duì)應(yīng)人體的頭部和手腕關(guān)節(jié);谒鲚斎肟臻g信息402,所述機(jī)器學(xué)習(xí)模型輸出所述鉸接對(duì)象的預(yù)測(cè)位姿406。

      另外,機(jī)器學(xué)習(xí)模型可以輸出與虛擬鉸接表示的關(guān)節(jié)相對(duì)應(yīng)的預(yù)測(cè)空間信息。人類用戶可以由具有卡通或非人類比例的虛擬化身Avatar表示。例如,預(yù)測(cè)的空間信息可能對(duì)應(yīng)于SMPL表示的關(guān)節(jié)。

      換句話說(shuō),鉸接表示的虛擬表示的關(guān)節(jié)不必與鉸接對(duì)象的關(guān)節(jié)具有1:1的對(duì)應(yīng)關(guān)系。因此,機(jī)器學(xué)習(xí)模型預(yù)測(cè)的空間信息輸出可以是針對(duì)與鉸接對(duì)象的n+m個(gè)關(guān)節(jié)不直接對(duì)應(yīng)的關(guān)節(jié)。例如,虛擬表示可能比鉸接對(duì)象具有更少的脊柱關(guān)節(jié)。

      機(jī)器學(xué)習(xí)模型可以用任何合適的方式進(jìn)行訓(xùn)練。在一個(gè)實(shí)施例中,機(jī)器學(xué)習(xí)模型可能先前使用具有鉸接對(duì)象的ground truth標(biāo)簽的訓(xùn)練輸入數(shù)據(jù)進(jìn)行訓(xùn)練。

      換句話說(shuō),可以為機(jī)器學(xué)習(xí)模型提供鉸接對(duì)象關(guān)節(jié)的訓(xùn)練空間信息,并標(biāo)記為指定空間信息所對(duì)應(yīng)的鉸接對(duì)象的實(shí)際姿態(tài)的ground truth標(biāo)簽。

      如上所述,可以訓(xùn)練機(jī)器學(xué)習(xí)模型以接收n+m個(gè)關(guān)節(jié)的空間信息作為輸入。這包括,在第一次訓(xùn)練迭代中,為機(jī)器學(xué)習(xí)模型提供所有n+m個(gè)關(guān)節(jié)的訓(xùn)練輸入數(shù)據(jù)。在隨后的一系列訓(xùn)練迭代中,m個(gè)關(guān)節(jié)的訓(xùn)練輸入數(shù)據(jù)可以逐漸被屏蔽。

      例如,在第二次訓(xùn)練迭代中,m個(gè)關(guān)節(jié)中的第一個(gè)關(guān)節(jié)可以被屏蔽,其中訓(xùn)練數(shù)據(jù)集中關(guān)節(jié)的空間信息替換為表示被屏蔽關(guān)節(jié)的預(yù)定義值,或者干脆省略。

      作為示例。在第三次訓(xùn)練迭代中,m個(gè)關(guān)節(jié)中的第二個(gè)關(guān)節(jié)可以被屏蔽,以此類推,直到m個(gè)關(guān)節(jié)都被屏蔽,并且只向機(jī)器學(xué)習(xí)模型提供了n個(gè)關(guān)節(jié)的空間信息。

      這一過(guò)程用圖5a-5d說(shuō)明。具體而言,在圖5A中,為機(jī)器學(xué)習(xí)模型400提供了一個(gè)訓(xùn)練輸入數(shù)據(jù)集。在本實(shí)施例中,訓(xùn)練輸入數(shù)據(jù)包括與所述鉸接對(duì)象的多個(gè)不同姿態(tài)相對(duì)應(yīng)的空間信息,包括第一姿態(tài)502A和第二姿態(tài)502B。

      在圖5A中,為機(jī)器學(xué)習(xí)模型提供了鉸接對(duì)象的n+m個(gè)關(guān)節(jié)的空間信息。在人體的簡(jiǎn)化表示中,每個(gè)代表關(guān)節(jié)的圓圈都使用了白色填充模式來(lái)表示這一點(diǎn)。但在圖5B中,504A被屏蔽,如圖所示,黑色填充圖案用于表示接頭504A的圓圈。

      換句話說(shuō),圖5A可以表示訓(xùn)練過(guò)程的第一次訓(xùn)練迭代,其中向機(jī)器學(xué)習(xí)模型提供了所有n+m個(gè)關(guān)節(jié)的空間信息。圖5B可以表示訓(xùn)練過(guò)程的第二次訓(xùn)練迭代,其中m個(gè)關(guān)節(jié)中的第一個(gè)關(guān)節(jié)504A被屏蔽。

      在圖5C中,所述鉸接表示的m個(gè)關(guān)節(jié)中的第二關(guān)節(jié)504B被遮擋。同樣,在圖5D中,m個(gè)關(guān)節(jié)中的第三個(gè)關(guān)節(jié)被遮擋?梢猿掷m(xù)進(jìn)行多次訓(xùn)練迭代,直到m個(gè)關(guān)節(jié)中的每個(gè)關(guān)節(jié)的空間信息被屏蔽,并且只向機(jī)器學(xué)習(xí)模型提供n個(gè)關(guān)節(jié)的空間信息。

      以上描述了鉸接對(duì)象為人體全身的場(chǎng)景。但鉸接對(duì)象可以采取其他形式。

      如圖7所示,鉸接對(duì)象是人手,而不是整個(gè)人體。具體而言,圖7顯示了一個(gè)示例機(jī)器學(xué)習(xí)模型700。

      機(jī)器學(xué)習(xí)模型700接收關(guān)節(jié)J1、J2和J3的空間信息,它們對(duì)應(yīng)于一個(gè)鉸接物體的三個(gè)關(guān)節(jié)704A-C,在本例中采用人手706的形式。

      具體來(lái)說(shuō),在這種情況下,n個(gè)關(guān)節(jié)包括人手的一個(gè)或多個(gè)手指關(guān)節(jié)。一個(gè)或多個(gè)手指關(guān)節(jié)的空間信息詳細(xì)描述了人手的一個(gè)或多個(gè)手指或手指段的參數(shù)。例如,空間信息可以指定手的手指的位置/方向,和/或應(yīng)用于手關(guān)節(jié)的旋轉(zhuǎn)。

      可以用任何合適的方法收集關(guān)節(jié)的空間信息,例如通過(guò)位置傳感器708。作為一個(gè)示例,位置傳感器可以采用配置為對(duì)人手成像的攝像頭形式。作為另一個(gè)示例,位置傳感器可以包括合適的射頻天線,其配置為將人手表面暴露于電磁場(chǎng),并評(píng)估天線處的電磁場(chǎng)阻抗如何受到導(dǎo)電人體皮膚的運(yùn)動(dòng)和接近的影響。

      基于輸入的空間信息702,機(jī)器學(xué)習(xí)模型輸出一組預(yù)測(cè)的空間信息710。空間信息710可構(gòu)成所述鉸接對(duì)象的預(yù)測(cè)位姿。如上所述,這樣的空間信息可以表示為鉸接對(duì)象的身體部位的位置/方向。

      名為“Pose prediction for articulated object”的微軟專利申請(qǐng)最初在2022年6月提交,并在日前由美國(guó)專利商標(biāo)局公布。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。