繼續(xù)見(jiàn)證5G+AI成長(zhǎng),進(jìn)博會(huì)全勤生高通確認(rèn)明年第八次參展來(lái)采銷直播間看京東11.11外設(shè)辦公總裁直播 11日14點(diǎn)準(zhǔn)時(shí)開(kāi)播第七屆進(jìn)博會(huì)盤點(diǎn):高通攜手伙伴展示的驍龍8至尊版旗艦終端備受關(guān)注產(chǎn)業(yè)合作推動(dòng)AI發(fā)展 高通孟樸:攜手伙伴共抓5G+AI新機(jī)遇進(jìn)博會(huì)看技術(shù)變化,從5G手機(jī)到AI終端,高通技術(shù)支持行業(yè)拓展    高通獲頒“2024新消費(fèi)創(chuàng)新案例”,5G-A推動(dòng)數(shù)字消費(fèi)高質(zhì)量發(fā)展3G追趕,4G并行,5G趕超!高通孟樸進(jìn)博會(huì)談與中國(guó)伙伴合作歷程京東11.11巔峰28小時(shí)倒計(jì)時(shí) 爆款耳機(jī)音箱5折開(kāi)搶手機(jī)內(nèi)卷下一站,AI Agent消息稱著名 AI 學(xué)者、天工智能首席科學(xué)家顏水成離開(kāi)昆侖萬(wàn)維昆侖萬(wàn)維SkyReels AI短劇平臺(tái)將于12月10日在美國(guó)正式上線韓國(guó)今年進(jìn)口柴油車銷量預(yù)計(jì)跌破 1 萬(wàn)輛,創(chuàng)近 17 年新低讓游戲黨一秒種草的大屏電視?海信這款百吋旗艦做到了!為用戶節(jié)省超120萬(wàn)元 京東11.11攜手奔圖加速打印國(guó)產(chǎn)化進(jìn)程京東3C數(shù)碼“瘋狂星期一”驚喜放價(jià) TP-LINK攝像頭限時(shí)直降210元11月9日晚8點(diǎn)京東11.11火熱開(kāi)啟!潮流配件9.9元起京東11.11最后一波Apple大放價(jià) iPhone 16 Pro系列持續(xù)加補(bǔ)1600元2024 ROG DAY狂歡啟航,ROG電競(jìng)顯示器助力三大戰(zhàn)車燃爆鄭州站!來(lái)京東11.11一次性搞定視頻、音頻等APP會(huì)員充值 省錢又省心歐萊雅中國(guó)"FUN YOUniverTH有意思青年"創(chuàng)變盛典耀動(dòng)進(jìn)博會(huì)
  • 首頁(yè) > 產(chǎn)經(jīng)新聞?lì)l道 > 業(yè)界新聞

    融云為WICC2021“新視界”帶來(lái)視頻壓縮技術(shù)新探索

    2021年08月12日 14:21:06   來(lái)源:中文科技資訊

      7月24日,以“新視界·連未來(lái)”為主題的2021全球互聯(lián)網(wǎng)通信云大會(huì)(以下簡(jiǎn)稱WICC 2021)在北京成功落下帷幕。來(lái)自主辦方全球互聯(lián)網(wǎng)通信云領(lǐng)導(dǎo)廠商融云的視頻算法專家黃震坤在“RTC新技術(shù)與應(yīng)用”技術(shù)分論壇中,分享了《基于人工智能的視頻編碼優(yōu)化》的演講。

    融云在WICC2021分論壇分享視頻編碼優(yōu)化技術(shù)

      圖1 WICC 現(xiàn)場(chǎng)融云視頻算法專家黃震坤發(fā)表演講

      根據(jù)美國(guó)思科公司的相關(guān)研究報(bào)告,到2022年,全球移動(dòng)數(shù)據(jù)流量將達(dá)到每年930艾字節(jié),相當(dāng)于通過(guò)全球網(wǎng)絡(luò)每5分鐘傳輸一遍有史以來(lái)所有電影的流量,視頻流量占移動(dòng)數(shù)據(jù)流量的比例將飆升至79%。巨大的傳輸壓力下,視頻編碼壓縮技術(shù)就顯得尤其重要。因此,本屆 WICC黃震坤聚焦于視頻壓縮的前沿技術(shù),針對(duì)不同場(chǎng)景需求,為開(kāi)發(fā)者闡述了視頻編碼方向的最新研究成果、融云的探索實(shí)踐,以及該領(lǐng)域未來(lái)的發(fā)展前景。

      融云在監(jiān)控場(chǎng)景的視頻壓縮技術(shù)及解決方案

      WICC 2021上,黃震坤以交通監(jiān)控視頻場(chǎng)景為例,闡述了隨著智慧交通的快速發(fā)展,交通監(jiān)控視頻的數(shù)據(jù)量呈現(xiàn)爆炸式增長(zhǎng),給現(xiàn)有的傳輸和存儲(chǔ)系統(tǒng)帶來(lái)了巨大的壓力,因此,提高監(jiān)控場(chǎng)景視頻壓縮的壓縮效率顯得至關(guān)重要。

      黃震坤認(rèn)為,要對(duì)交通監(jiān)控視頻進(jìn)行高效壓縮,就必須根據(jù)該場(chǎng)景特點(diǎn),將背景區(qū)域和運(yùn)動(dòng)區(qū)域細(xì)致區(qū)分。典型的背景區(qū)域包括建筑、樹(shù)木等,在畫面中占比較大,且相對(duì)固化、變化不大;運(yùn)動(dòng)區(qū)域包括車輛、行人等,只占整個(gè)視頻區(qū)域的一小部分。典型的監(jiān)控視頻如圖2所示,運(yùn)動(dòng)的車輛即為前景區(qū)域。整體而言,視頻的相鄰幀之間的變化細(xì)微,應(yīng)成為監(jiān)控視頻壓縮關(guān)注的重點(diǎn)。

    融云在WICC2021分論壇分享視頻編碼優(yōu)化技術(shù)

      圖2 典型的監(jiān)控場(chǎng)景

      針對(duì)這些特點(diǎn),業(yè)界早期的做法是在重建幀中選擇出長(zhǎng)期參考幀,并與己有短期參考幀組合,一起供當(dāng)前待編碼幀做幀間預(yù)測(cè)的參考。但是,選取的長(zhǎng)期參考幀可能包含有前景物體,導(dǎo)致背景幀“不干凈”。

      為了解決這個(gè)難點(diǎn),融云采用 LaBGen-P 的方法提取背景幀,這是由于 LaBGen-P 采用了像素級(jí)中值濾波的機(jī)制,基于運(yùn)動(dòng)檢測(cè)的選擇機(jī)制,選擇運(yùn)動(dòng)最小的像素作為背景像素。通過(guò)幀間差的運(yùn)算,可提取到純背景幀的視頻效果。

      并且,用 LaBGen-P 的方法提取背景幀,將獲取的背景幀加入到長(zhǎng)期參考幀列表,不但可以避免網(wǎng)損和解碼錯(cuò)誤會(huì)導(dǎo)致解碼器出現(xiàn)錯(cuò)誤,導(dǎo)致誤差擴(kuò)散到后續(xù)的P幀,而且利用反饋機(jī)制與長(zhǎng)期參考幀相結(jié)合,還有助于修復(fù)丟失的視頻數(shù)據(jù)。

      實(shí)驗(yàn)表明,和原始沒(méi)有加入背景幀的 OpenH264 編碼器相比,可將標(biāo)準(zhǔn)測(cè)試集中的測(cè)試視頻

      CiscoVT2people_320x192_12fps.yuv,從原始的 56KB 減少到 54KB。

      感興趣區(qū)域的視頻壓縮技術(shù)研究模型及實(shí)踐探索

      不同的場(chǎng)景人們的關(guān)注重點(diǎn)會(huì)有所不同。仍以智慧交通為例,交警對(duì)于違章車輛的關(guān)注點(diǎn)是車牌號(hào),車牌號(hào)是否清晰,將直接影響執(zhí)法證據(jù)的收集是否有效。因此,在帶寬有限的情況下,確保興趣關(guān)注區(qū)域的質(zhì)量是視頻壓縮技術(shù)的關(guān)鍵。

      傳統(tǒng)編碼方法致力于對(duì)圖像進(jìn)行去相關(guān)處理,這種方法雖然可以達(dá)到去除信息冗余度的效果,但是忽略了視覺(jué)冗余。因此,在最新研究中,典型做法是,通過(guò)對(duì)視頻進(jìn)行目標(biāo)檢測(cè)來(lái)獲取感興趣區(qū)域,再對(duì)感興趣區(qū)域分配更多的碼率,從而提高該區(qū)域的編碼質(zhì)量。圖3即為典型的采用目標(biāo)檢測(cè)技術(shù)檢測(cè)到的感興趣區(qū)域,并進(jìn)行碼率分配的效果,感興趣區(qū)域的編碼質(zhì)量得到保證。

    融云在WICC2021分論壇分享視頻編碼優(yōu)化技術(shù)

      圖3 典型的基于目標(biāo)檢測(cè)碼率分配效果

      如何向感興趣區(qū)域分配更多的碼率,黃震坤分別向開(kāi)發(fā)者介紹了學(xué)術(shù)界代表武漢大學(xué)的理論研究和產(chǎn)業(yè)界代表融云的探索實(shí)踐。

      武漢大學(xué)在2021年提出了基于博弈論的碼率分配方案模型,具體內(nèi)容包括:

      感興趣區(qū)域編碼質(zhì)量為領(lǐng)導(dǎo)者,非感興趣區(qū)域的編碼質(zhì)量為跟隨者;

      在設(shè)定的目標(biāo)碼率下,領(lǐng)導(dǎo)者決定感興趣區(qū)域分配的碼率,而跟隨者決定非感興趣區(qū)域的分配的碼率;

      對(duì)于感興趣區(qū)域來(lái)說(shuō),它的效用不僅取決于自身,而且影響到整個(gè)圖像的編碼質(zhì)量;

      非感興趣區(qū)域只能利用余下的碼率達(dá)到最優(yōu)的效用。

      而融云的感興趣區(qū)域的視頻編碼方案是,將運(yùn)動(dòng)區(qū)域檢測(cè)和基于博弈論碼率分配方案相結(jié)合,整合為基于場(chǎng)景的感興趣區(qū)域檢測(cè)和碼率分配方案。這一方案的特點(diǎn)主要體現(xiàn)在訓(xùn)練不同的 yolo 模型,采用同一個(gè)預(yù)訓(xùn)練模型 yolo,訓(xùn)練不同的場(chǎng)景。

    融云在WICC2021分論壇分享視頻編碼優(yōu)化技術(shù)

      圖4 融云感興趣區(qū)域視頻編碼方案

      具體地說(shuō),針對(duì)人的視頻采用訓(xùn)練好的基于人的目標(biāo)檢測(cè)模型,針對(duì)車的視頻采用訓(xùn)練好的基于車的目標(biāo)檢測(cè)模型。其中運(yùn)動(dòng)檢測(cè)的方法選用Vibe,為每個(gè)像素點(diǎn)建立一個(gè)樣本背景模型(背景模型中包含N 個(gè)樣本值),計(jì)算待分類像素與背景模型的相似度,如果相似,則分類為背景。

    融云在WICC2021分論壇分享視頻編碼優(yōu)化技術(shù)

      圖5 目標(biāo)和運(yùn)動(dòng)檢測(cè)結(jié)合的感興趣區(qū)域提取效果

      通過(guò)實(shí)驗(yàn)可以看出,提取了感興趣區(qū)域之后,采用基于博弈論的方法分配感興趣區(qū)域和非感興趣區(qū)域的碼率,最終在有限帶寬的情況下,使得感興趣區(qū)域的編碼質(zhì)量獲得提高, 整體的編碼質(zhì)量也損失不大。具體效果見(jiàn)圖6所示,人臉部分的量化系數(shù)比背景區(qū)域的量化系數(shù)要小,在帶寬受限的情況下,能夠保留人臉部分的細(xì)節(jié)。

    融云在WICC2021分論壇分享視頻編碼優(yōu)化技術(shù)

      圖6 基于感興趣區(qū)域的碼率分配效果

      視頻壓縮技術(shù)的最新研究和應(yīng)用前景

      目前在視頻壓縮的研究方面,主要是基于人工智能的深度學(xué)習(xí)技術(shù)和端到端的視頻壓縮框架。

      深度學(xué)習(xí)技術(shù)替換混合編碼框架模塊,可用于碼率分配、塊劃分以及幀內(nèi)預(yù)測(cè)和幀間預(yù)測(cè)。以幀間預(yù)測(cè)為例,實(shí)驗(yàn)結(jié)果表明,與 HEVC 相比,基于深度學(xué)習(xí)所提出的方法在low delay P配置下,能達(dá)到平均1.7%(最高為8.6%)的碼率減少。端到端的視頻壓縮框架最新研究成果是對(duì)現(xiàn)有深度學(xué)習(xí)視頻壓縮,只能利用少數(shù)的參考幀進(jìn)行壓縮的問(wèn)題, 研究人員提出了重復(fù)自編碼器和重復(fù)概率估計(jì)模型。

      黃震坤介紹,這些技術(shù)目前都尚處于非常前沿的研究階段,但擁有著非常廣闊的應(yīng)用前景:首先,采用深度學(xué)習(xí)網(wǎng)絡(luò)替換視頻壓縮的混合編碼框架,可以提高編碼效率,在 WebRTC 中具有重要的應(yīng)用價(jià)值;其次,深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)對(duì)碼率進(jìn)行分配,將改善在使用 WebRTC 視頻傳輸中的卡頓現(xiàn)象;第三,基于深度學(xué)習(xí)的帶寬估計(jì)模型也將比傳統(tǒng)的帶寬估計(jì)方法更有優(yōu)勢(shì)。

      結(jié)語(yǔ)

      在實(shí)時(shí)音視頻領(lǐng)域,視頻壓縮是非常重要的技術(shù)。隨著5G基礎(chǔ)設(shè)施的完善,新的視頻應(yīng)用場(chǎng)景不斷涌現(xiàn),視頻壓縮技術(shù)也在迭代。為了確保視頻高質(zhì)量和高傳輸效率,視頻壓縮技術(shù)要考慮存儲(chǔ)、編解碼、算力和帶寬等因素在內(nèi)的總成本,要在畫質(zhì)、碼率和性能之間做平衡。隨著 5G 基礎(chǔ)設(shè)施的完善,新的視頻應(yīng)用場(chǎng)景不斷涌現(xiàn),視頻壓縮技術(shù)也會(huì)不斷迭代創(chuàng)新。而融云將深度參與其中,引領(lǐng)發(fā)展!

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    [No. X073]
    分享到微信

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。