合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運(yùn)行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機(jī)器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機(jī)器也能說人話了?
  • 首頁 > 企業(yè)IT頻道 > ARVRMR

    這項Avatar專利,讓我看到了未來蘋果生態(tài)與AR/VR頭顯的融合

    2022年10月21日 18:30:38   來源:青亭網(wǎng)

      蘋果研發(fā)AR/VR頭顯幾乎已經(jīng)是公開的秘密,尤其是從近年來該公司申請的一系列專利中,可以看到各類與AR/VR相關(guān)的技術(shù),涵蓋了UI、UX、硬件、光學(xué)、數(shù)據(jù)傳輸、傳感器等多個方面。比如前不久,USPTO就公布了一項來自蘋果的3D Avatar相關(guān)專利,其中描述了一種低成本3D形象掃描方案,可使用XR頭顯、手機(jī)、平板電腦、電腦攝像頭來掃描頭部、手部、軀干等不同的身體部位,生成的虛擬化身動作由用戶控制,可在AR/VR等3D場景中移動。

    微信圖片_20220905154349

      這項專利相當(dāng)有趣,它設(shè)想了將移動設(shè)備和AR/VR頭顯搭配,來生成3D虛擬形象的界面和流程。如果未來蘋果真的發(fā)布AR/VR頭顯,該專利描述的方案也足夠?qū)嵱茫坪趵矛F(xiàn)有的技術(shù)就能實現(xiàn)。當(dāng)然我們知道,通常大公司申請專利并不一定會應(yīng)用專利中的技術(shù),也可能是為了預(yù)防競爭、豐富技術(shù)積累等等。不過,也不排除部分專利內(nèi)容實際應(yīng)用的可能,通過分析專利我們多少可以了解蘋果在相關(guān)技術(shù)上的探索,以及未來的潛在發(fā)展方向等等。

      關(guān)于Avatar生成

      據(jù)了解,這項專利的標(biāo)題為“在3D環(huán)境中表現(xiàn)Avatar的界面”,主要描述了如何生成3D Avatar,以及使用Avatar與XR場景互動的實現(xiàn)方式。專利中涉及了大量和全身Avatar相關(guān)細(xì)節(jié),比如可以用移動設(shè)備的攝像頭掃描用戶面部(類似于Face ID功能),用XR頭顯的多攝像頭系統(tǒng)追蹤用戶的手、腳、軀干、手臂、肩膀等身體部位。

    微信圖片_20220905154403

      具體的使用流程如下:

      1)面部掃面界面:使用者需摘除眼鏡,并保持頭部靜止,然后將移動設(shè)備的攝像頭圍著頭部旋轉(zhuǎn)。該功能似乎不需要360°頭部建模,因此使用者自己用手掃描面部兩側(cè)和正臉即可,無需其他人協(xié)助。

    微信圖片_20220905154401

      有趣的是,專利中描述的頭部掃描機(jī)制有點(diǎn)類似于手機(jī)上的指紋錄入,需要經(jīng)過多次頭部捕捉才能完成頭部建模。另外,你還需要掃描各種表情,比如微笑、張嘴等等。

    微信圖片_20220905154354

      2)面部掃描完成后,便可以設(shè)置Avatar參數(shù),比如身高、鏡框等飾品。

    微信圖片_20220905154332

      3)之后,你需要戴上AR/VR頭顯來掃描雙手。

    微信圖片_20220905154410

      目前,Meta Reality Labs也在探索基于移動設(shè)備的輕量化3D面部捕捉方案,從此前曝光的Codec Avatar研究進(jìn)度來看,Meta已經(jīng)可以用iPhone 12的前置鏡頭來進(jìn)行高保真的3D面部捕捉和重建,還可以合成全新的3D視角和表情,效果足夠優(yōu)秀。該方案基于iPhone 12的Face ID相機(jī)模組,F(xiàn)ace ID是目前市面上最先進(jìn)的移動3D面部掃描方案之一,足以輔助AR/VR頭顯進(jìn)行面部追蹤和捕捉。如果利用部分iPhone配備的LiDAR傳感器掃描人臉,效果還會更精準(zhǔn)。

      從此前的預(yù)測來看,蘋果AR/VR頭顯將配備多組3D傳感器,用于追蹤眼球和面部表情變化,并用來控制Animoji等動畫虛擬頭像。如果結(jié)合iPhone端面部掃描,蘋果AR/VR用戶將可以自然生成自己的3D形象,并在AR/VR中使用,蘋果產(chǎn)品生態(tài)可以很容易做到這樣的功能。

      而手勢識別部分,目前Quest通過外部攝像頭和計算機(jī)視覺算法已經(jīng)能追蹤手部節(jié)點(diǎn),未來蘋果AR/VR頭顯應(yīng)該也會內(nèi)置某種手勢識別模塊。

      關(guān)于交互方式

      完成3D面部掃描后,用戶將扮演Avatar,在XR場景中通過視覺、觸覺、聽覺、味覺和嗅覺來感知物理環(huán)境,并與之互動。在AR模式中,系統(tǒng)可生成虛擬物體(如樹木、建筑物)并與物理環(huán)境融合,系統(tǒng)可為虛擬物體渲染與環(huán)境光匹配的光影。甚至,還可以通過傳感器對物理環(huán)境中的物體進(jìn)行復(fù)制,復(fù)制的虛擬物體可具有類似的形狀或顏色。

      蘋果在去年WWDC上曾公布一款基于攝影測量法的3D掃描工具,可將任何物體掃描成3D模型,相當(dāng)于利用數(shù)字技術(shù)對實際物體進(jìn)行高保真“復(fù)制”。掃描生成的3D模型為USDZ文件格式,可直接嵌入到網(wǎng)頁中預(yù)覽、以AR的形式查看并通過iMessage與其他人分享。雖然該工具目前未在C端落地,但此前展示的demo視頻看起來效果十分驚艷,3D模型和實物看起來相當(dāng)接近。

      除了用動作和XR環(huán)境交互外,用戶還可以通過視覺、聽覺、觸覺、味覺和嗅覺來交互,或是發(fā)出語音指令來調(diào)整虛擬對象的特征。

      在一些XR場景中,用戶只能聽到聲音,并和音頻互動。比如,XR可識別用戶的頭部轉(zhuǎn)動,實時調(diào)整空間音頻和視覺效果,以還原聲音和光線在真實空間中的特性。專利還指出,XR中的音頻可支持“通透模式”,即有選擇性的將環(huán)境音和計算機(jī)生成的音頻融合。我們知道,蘋果AirPods Pro/Max耳機(jī)就支持“通透模式”,在聽歌時可主動降低環(huán)境噪音,未來如果應(yīng)用于XR設(shè)備,將允許用戶與周圍的人、環(huán)境之間保持互動。

    微信圖片_20220905154327

      有趣的是,你可以在XR中用音頻代表自己,或是選擇可視化的Avatar,大概就像是在微信中你可以選擇語音或視頻通話那樣。

    微信圖片_20220905154417

      另外,從蘋果往年專利可以看出,其習(xí)慣在專利中將混合現(xiàn)實、虛擬現(xiàn)實和擴(kuò)展現(xiàn)實(XR)分開定義,其中XR指的是一種部分或完全模擬的環(huán)境,人們可以通過電子系統(tǒng)感知這個環(huán)境并與之交互。在XR環(huán)境中,用戶的物理運(yùn)動是實時追蹤的,并在XR中得到表示,同時XR環(huán)境也會對用戶的動作做出反饋,以模擬物理交互。

      而XR體驗可能來自于多種圖像生成組件,如頭顯、顯示屏、投影儀、觸摸屏等等。還可能配備多個傳感器,包括圖像傳感器、光傳感器、深度傳感器、觸覺傳感器、方向傳感器、溫度傳感器、位置傳感器、運(yùn)動傳感器、速度傳感器、XR地圖生成單元等等。

      關(guān)于頭顯硬件

      蘋果在專利背景中指出:近年來,AR/VR計算系統(tǒng)的開發(fā)顯著增加,與AR/VR內(nèi)容交互的方式也多種多樣,比如攝像頭手勢識別、手柄、搖桿、觸控表面、觸屏等等。用戶通過這些交互方式,可控制AR圖像、AR視頻、AR文本、AR圖標(biāo)等對象。

      蘋果認(rèn)為,目前AR/VR的一些交互方式比較麻煩、低效、可獲得的反饋有限。比如相比于手勢交互,手柄對初學(xué)者不夠友好,而且具有一定重量,容易打破沉浸感。另外,如果想要追蹤全身動作,則可能需要全身體感服,或是多個追蹤模塊,操作起來比較復(fù)雜,而且笨重。這些輸入方式的計算量比較大,比較耗電,對于需要電池供電的AR/VR一體機(jī)來講并不友好。

      因此,需要一種更加有效、直觀、容易理解的人機(jī)交互方式。

      硬件方面,蘋果Avatar專利方案需要某種圖像生成計算機(jī)系統(tǒng),以及一個或多個具有計算生成能力的輸入設(shè)備,如虛擬現(xiàn)實、混合現(xiàn)實顯示設(shè)備,或是臺式計算機(jī)、移動設(shè)備(手機(jī)、筆記本、平板電腦、手持設(shè)備)、可穿戴電子設(shè)備(智能手表)。

      其硬件設(shè)備可能配備觸控板、攝像頭組、觸屏、眼球追蹤模塊、手勢追蹤模塊。此外,還可以搭配體感和音頻配件。此外,或采用圖形用戶界面(GUI),支持觸控筆、指尖輸入、觸控和手勢輸入、眼球輸入、語音輸入。用戶也可以通過全身姿態(tài)來和GUI交互,姿態(tài)通過攝像頭等傳感器來捕捉。

      用戶可通過這些交互方式在GUI中進(jìn)行繪畫、修圖、演示、文字處理、制作圖標(biāo)、玩游戲、打電話、開視頻會議、發(fā)郵件、發(fā)信息、健身、拍照、拍視頻、看網(wǎng)頁、聽音樂、記筆記、看視頻等等。參考:PatentlyApple,USPTO

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。