我們?cè)跒g覽Youtube的時(shí)候應(yīng)該都經(jīng)歷過兩件非常令人沮喪的事情:視頻的畫面要么突然變得很模糊,要么就完全停下來開始緩沖。
這兩種情況都是由于一些特殊的算法造成的,它們將視頻分解成小塊,然后你一邊看的同時(shí)它們就一邊在加載。如果你的網(wǎng)絡(luò)速度很慢,YouTube可能會(huì)在接下來的幾秒鐘里播放低分辨率的視頻,以確保你仍然可以不間斷地觀看——因此,就出現(xiàn)了視頻畫面變得模糊的情況。如果你嘗試跳過尚未加載的視頻的部分,這樣的話,畫面就必須停止,以緩沖那些還沒有加載的部分。
YouTube使用這些自適應(yīng)的比特率(ABR)算法,試圖給用戶提供更一致的觀看體驗(yàn)。他們也節(jié)省了帶寬,因?yàn)槿藗兺ǔ2粫?huì)一直從頭到尾觀看視頻。因此,如果一直為所有用戶都提供成千上萬個(gè)時(shí)長(zhǎng)較長(zhǎng)視頻的緩沖,其實(shí)是一個(gè)巨大的浪費(fèi)資源。
雖然ABR算法已經(jīng)做得很不錯(cuò)了,但觀眾對(duì)流媒體視頻的期望卻在不斷增長(zhǎng),而且在像Netflix和YouTube這樣的網(wǎng)站不得不在視頻質(zhì)量和緩沖的頻率之間做出不完美的權(quán)衡時(shí),觀眾的日益增長(zhǎng)的期望越來越不能被滿足。
MIT的教授Mohammad Alizadeh表示:“研究表明,如果質(zhì)量太低,用戶就會(huì)放觀看視頻,從而導(dǎo)致內(nèi)容提供商的廣告收入出現(xiàn)重大損失。因此,視頻網(wǎng)站必須不斷尋找創(chuàng)新的新方法。”
在這些方面,Alizadeh和他在MIT計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(CSAIL)的團(tuán)隊(duì)已經(jīng)開發(fā)出了“Pensieve”這樣一個(gè)AI系統(tǒng)。它使用機(jī)器學(xué)習(xí)根據(jù)網(wǎng)絡(luò)條件選擇不同的算法。它已經(jīng)被證明了能夠比現(xiàn)有的系統(tǒng)提供更高質(zhì)量的視頻觀看體驗(yàn)。
具體地說,在實(shí)驗(yàn)中,研究小組發(fā)現(xiàn),Pensieve可以比其他方法更少地減少10%到30%的緩沖,而用戶在“體驗(yàn)質(zhì)量”(QoE)指標(biāo)上的評(píng)分則要高出10%到25%。
Pensieve也可以根據(jù)內(nèi)容提供者的優(yōu)先級(jí)進(jìn)行定制。例如,如果一個(gè)在地鐵上的用戶即將進(jìn)入一個(gè)沒有網(wǎng)絡(luò)的區(qū)域,YouTube可以關(guān)閉比特率,這樣它就可以加載足夠的視頻,這樣它就不會(huì)在沒有網(wǎng)絡(luò)的區(qū)域出現(xiàn)緩沖停頓的畫面。
“我們的系統(tǒng)對(duì)你想要優(yōu)化它的任何東西都是靈活的,”博士生Hongzi Mao表示。他相關(guān)論文的第一作者,同署名的還有Alizadeh和博士生Ravi Netravali。“你甚至可以想象為單個(gè)用戶定制的個(gè)性化視頻體驗(yàn),基于他們是否想要將不要緩沖的優(yōu)先級(jí)設(shè)置為高于分辨率。
這篇論文將于下周在洛杉磯召開的SIGCOMM會(huì)議上進(jìn)行講演。團(tuán)隊(duì)也會(huì)在那個(gè)時(shí)候?qū)Υa進(jìn)行開源。
論文地址
ABR是如何工作的
廣義地說,有ABR算法有兩種:
1)rate-based的算法,衡量網(wǎng)絡(luò)傳輸數(shù)據(jù)的速度;
2)buffer-based的算法,確保一定數(shù)量的視頻已經(jīng)被緩沖了。
這兩種類型都受到一定的限制,因?yàn)樗鼈儧]有同時(shí)使用關(guān)于速率和緩沖的信息。因此,這些算法通常會(huì)做出糟糕的比特率決策,并需要由人類專家進(jìn)行仔細(xì)的手工調(diào)整,以適應(yīng)不同的網(wǎng)絡(luò)環(huán)境。
研究人員還試圖將這兩種方法結(jié)合起來:CMU的研究人員開發(fā)了“模型預(yù)測(cè)控制”(MPC)系統(tǒng),該方法旨在通過預(yù)測(cè)條件如何隨時(shí)間演變來優(yōu)化決策。這是一個(gè)重大的提升,但仍然存在著網(wǎng)絡(luò)速度等因素難以建模的問題。
“建模網(wǎng)絡(luò)動(dòng)力是很困難的。即使有了像MPC這樣的方法,你最終只會(huì)和你的模型一樣好。”Alizadeh表示。
Pensieve并不需要一個(gè)模型,也不需要任何像網(wǎng)絡(luò)速度這樣的現(xiàn)有假設(shè)。它表現(xiàn)為一個(gè)神經(jīng)網(wǎng)絡(luò)式的ABR算法,并在有廣泛緩沖和網(wǎng)絡(luò)速度條件的情況下反復(fù)進(jìn)行測(cè)試。
該系統(tǒng)通過獎(jiǎng)勵(lì)和懲罰系統(tǒng)來調(diào)整算法。例如,它可以得到一個(gè)獎(jiǎng)勵(lì),如果用戶得到了高分辨率體驗(yàn),但是如果它停下來緩沖的話,就會(huì)受到懲罰。
“它會(huì)了解不同的戰(zhàn)略對(duì)績(jī)效的影響,而且,通過觀察過去的實(shí)際表現(xiàn),它可以以一種更加穩(wěn)健的方式改善決策體系。”這篇論文的第一作者M(jìn)ao表示。
像YouTube這樣的內(nèi)容提供商可以根據(jù)他們想要為用戶設(shè)定優(yōu)先級(jí)的標(biāo)準(zhǔn)來定制Pensieve的獎(jiǎng)勵(lì)系統(tǒng)。例如,研究表明,在視頻前期,觀眾更容易接受緩沖,因此該算法可以將緩沖的懲罰調(diào)整到一個(gè)更大的度上。
將機(jī)器學(xué)習(xí)與深度學(xué)習(xí)技術(shù)相結(jié)合
該團(tuán)隊(duì)在幾個(gè)場(chǎng)合測(cè)試了Pensieve,包括在咖啡館使用Wifi和在街上行走時(shí)使用LTE網(wǎng)絡(luò)。實(shí)驗(yàn)表明,Pensieve可以實(shí)現(xiàn)與MPC相同的視頻分辨率,但緩沖卻減少了10%到30%。
CMU電子和計(jì)算機(jī)工程助理教授Vyaz Sekar表示:“以前的方法試圖使用基于人類專家直覺的控制邏輯。”這項(xiàng)工作展示了機(jī)器學(xué)習(xí)方法的前景。
Mao表示,研究小組的實(shí)驗(yàn)表明,即使在以前從未見過的情況下,Pensieve也能很好地工作。
他說:“當(dāng)我們?cè)?lsquo;boot camp’中使用綜合數(shù)據(jù)測(cè)試的時(shí)候,它發(fā)現(xiàn)了ABR算法對(duì)真實(shí)的網(wǎng)絡(luò)來說足夠強(qiáng)大。這種壓力測(cè)試表明,它對(duì)于現(xiàn)實(shí)世界中的新場(chǎng)景擁有不俗的表現(xiàn)。”
Alizadeh還指出,Pensive僅僅接受了一個(gè)月的下載視頻的訓(xùn)練。如果該團(tuán)隊(duì)擁有Netflix或YouTube規(guī)模數(shù)據(jù),他說他預(yù)計(jì)Pensieve的表現(xiàn)將會(huì)有更大的提升。
接下來,他的團(tuán)隊(duì)將在虛擬現(xiàn)實(shí)(VR)視頻中測(cè)試Pensieve。
本文轉(zhuǎn)自微信公眾號(hào)“將門創(chuàng)投”(ID:thejiangmen),來源:news.mit.edu。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。