還能再漲23%!AI寵兒NVIDIA成大摩明年首選AMD FSR 4.0將與RX 9070 XT顯卡同步登場羅永浩細紅線最新進展,暫別AR,迎來AI Jarvis構(gòu)建堅實數(shù)據(jù)地基,南京打造可信數(shù)據(jù)空間引領(lǐng)數(shù)字城市建設(shè)下單前先比價不花冤枉錢 同款圖書京東價低于抖音6折日媒感慨中國電動汽車/智駕遙遙領(lǐng)先:本田、日產(chǎn)、三菱合并也沒戲消委會吹風機品質(zhì)檢測結(jié)果揭曉 徠芬獨占鰲頭 共話新質(zhì)營銷力,2024梅花數(shù)據(jù)峰會圓滿落幕索尼影像專業(yè)服務 PRO Support 升級,成為會員至少需注冊 2 臺 α 全畫幅相機、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競賽:6500mAh 旗艦機+7500mAh中端機寶馬M8雙門轎跑車明年年初將停產(chǎn),后續(xù)無2026款車型比亞迪:2025 款漢家族車型城市領(lǐng)航智駕功能開啟內(nèi)測雷神預告2025年首次出席CES 將發(fā)布三款不同技術(shù)原理智能眼鏡realme真我全球首發(fā)聯(lián)發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計劃iQOO Z9 Turbo長續(xù)航版手機被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷量大跌:曝保時捷將重新評估電動汽車計劃來京東參與榮耀Magic7 RSR 保時捷設(shè)計預售 享365天只換不修國補期間電視迎來換機潮,最暢銷MiniLED品牌花落誰家?美團旗下微信社群團購業(yè)務“團買買”宣布年底停運消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機設(shè)備
  • 首頁 > 數(shù)據(jù)存儲頻道 > 數(shù)據(jù)庫頻道 > 操作系統(tǒng)與開源

    馬克斯普朗克開源項目VNect用2D攝像頭實現(xiàn)低成本動捕

    2018年05月10日 14:10:26   來源:yivian

      2018年05月10日,大部分應用都需要實時將用戶及其運動映射至3D空間。在以前,我們只能通過昂貴的所相機系統(tǒng),或者令用戶穿上特殊的傳感器套裝才能實現(xiàn)。昨天映維網(wǎng)報道了RADiCAL的技術(shù),現(xiàn)在據(jù)映維網(wǎng)了解(消息源:李今),馬克斯普朗克計算機科學研究所的計算機科學家開發(fā)出了一種只需要單個攝像頭的系統(tǒng),而且它甚至可以預測用戶在預錄制視頻中的三維姿勢,比如說YouTube視頻。

      博士后學生Dushyant Mehta表示:“這允許通過手機來捕捉視頻,同時實現(xiàn)身體追蹤。能夠?qū)崟r在3D中實現(xiàn)這一點,而且只是借助移動設(shè)備上的攝像頭,這是一個巨大的進步。”

      Mehta與同事研發(fā)了只需一個傳統(tǒng)攝像頭就可以實時捕捉用戶及其運動的軟件系統(tǒng)。研究人員Srinath Sridhar解釋說:“到目前為止,多攝像頭系統(tǒng),或者像Kinect這樣深度攝像頭對這項任務來說都是必不可少的工具。”

      新系統(tǒng)基于神經(jīng)網(wǎng)絡(luò),而研究人員將其稱之為“卷積神經(jīng)網(wǎng)絡(luò)”(簡稱CNN),而這通常是與“深度學習”聯(lián)系在一起。馬克斯普朗克計算機科學研究所的研究人員開發(fā)了一種新方法,其能夠借助神經(jīng)網(wǎng)絡(luò)從視頻流的二維信息中計算用戶的三維姿態(tài)。

      他們在官網(wǎng)上公布了一個演示視頻。一位研究人員在后面玩雜耍,而前方的顯示器則播放相應的視頻錄像。我們看到右邊的畫面疊加了一個簡單的火柴人。另一個三維視圖則顯示了相應的運動,其用于說明研究人員能夠?qū)崟r捕捉完整的三維姿態(tài)。無論研究人員移動肢體的速度有多快,或者移動幅度有多大,火柴人都會進行相應的三維運動,而另一個顯示器中的虛擬角色同樣如此。

      研究人員將他們的系統(tǒng)稱為“VNect”。VNect既可以預測人物的三維姿態(tài),也可以定位圖人物的位置。這允許系統(tǒng)避免在不包含人類的圖像區(qū)域上浪費計算。在機器學習過程中,系統(tǒng)的神經(jīng)網(wǎng)絡(luò)通過數(shù)萬個注釋圖像進行訓練。系統(tǒng)根據(jù)關(guān)節(jié)角度提供三維姿態(tài)信息,而這可以輕松用于控制虛擬角色。

      Mehta補充說:“NVect令更廣泛的人群可以觸及虛擬現(xiàn)實的三維身體姿態(tài)追蹤,因為他們不需要Kinect或其他攝像頭,無需要穿戴特殊的傳感器套件,只需使用十分普遍的網(wǎng)絡(luò)攝像頭即可。這同時可以為第一人稱VR帶來全新的體驗。”除了這種交互式角色控制之外,VNect還是第一個可以用來預測視頻中人物3D姿勢的系統(tǒng),比如說YouTube視頻。馬克斯普朗克計算機科學研究所的Christian Theobalt教授接著說道:“從人機交互到人類與機器人交互,再到工業(yè)4.0,這還有其他許多的應用。我們同時可以考慮自動駕駛,汽車在未來或許可以通過攝像頭來預測人們的完整表達運動,然后評估他們的行為。”

      但VNect仍然存在局限性。姿態(tài)估計的準確度比多相機系統(tǒng)或基于標記的姿態(tài)估計系統(tǒng)更低。如果人臉被遮擋,運動速度太快,或者出現(xiàn)沒有訓練過的姿勢,系統(tǒng)將出現(xiàn)問題。另外,多用戶場景也是一個問題。盡管如此,Sridhar相信技術(shù)將會進一步成熟,并且能夠處理越來越復雜的場景,從而可以在日常生活中使用。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。