AI賦能剪紙藝術(shù),剪映助力多地文旅點(diǎn)亮新春3年150億! 京東與石頭科技達(dá)成線上渠道銷售額目標(biāo)巴塞羅那VS瓦倫西亞:兩支西甲傳統(tǒng)隊(duì)志在為各自目標(biāo)全取三分辭舊迎新 繼往開來——西甲聯(lián)盟2024大事跡回顧與2025新年展望澳雷朗2024年度業(yè)績(jī)穩(wěn)健增長(zhǎng),創(chuàng)新驅(qū)動(dòng)門店建設(shè)與服務(wù)升級(jí)OpenAI CEO宣布ChatGPT免費(fèi)版將引入o3-mini,效率翻倍!中國(guó)聯(lián)通發(fā)布元景思維鏈大模型:性能超越GPT-4300倍體積縮減!Hugging Face推SmolVLM模型:小巧智能,手機(jī)也能跑商務(wù)部數(shù)據(jù)顯示已有792萬人申請(qǐng)手機(jī)等數(shù)碼購(gòu)新補(bǔ)貼 用國(guó)補(bǔ)買手機(jī)上京東元象推出智能數(shù)字人平臺(tái)「元象日播」追覓空氣凈化器震撼登場(chǎng):集成多項(xiàng)創(chuàng)新技術(shù),凈化、送風(fēng)、制暖三合一!HeyGen推出數(shù)字人運(yùn)動(dòng)控制功能 能彈樂器還能跳舞潛在智能泊車故障 小米汽車召回共計(jì)30931臺(tái)SU7標(biāo)準(zhǔn)版電動(dòng)汽車AI視頻的2025:“價(jià)格戰(zhàn)”打響,哪家大模型最適合“上車”?2025,“出海速度”看數(shù)字化SensorTower發(fā)布2024年中國(guó)手游出海收入榜與發(fā)行商收入榜:多款新游增長(zhǎng)亮眼人形機(jī)器人,自動(dòng)駕駛“老炮”創(chuàng)業(yè)第二站用AI做智駕的理想汽車,能撐起李想的AI理想嗎?直播間里,藏著毛衫界的「胖東來」中小手型鼠標(biāo)選購(gòu)指南,游戲黨春節(jié)電競(jìng)狂歡必備!
  • 首頁(yè) > 3C消費(fèi)頻道 > 手機(jī)數(shù)碼

    新機(jī)器學(xué)習(xí)系統(tǒng)Pensieve 讓你和網(wǎng)絡(luò)視頻卡頓說再見!

    2017年08月15日 17:45:41   來源:36氪

      我們?cè)跒g覽Youtube的時(shí)候應(yīng)該都經(jīng)歷過兩件非常令人沮喪的事情:視頻的畫面要么突然變得很模糊,要么就完全停下來開始緩沖。

      這兩種情況都是由于一些特殊的算法造成的,它們將視頻分解成小塊,然后你一邊看的同時(shí)它們就一邊在加載。如果你的網(wǎng)絡(luò)速度很慢,YouTube可能會(huì)在接下來的幾秒鐘里播放低分辨率的視頻,以確保你仍然可以不間斷地觀看——因此,就出現(xiàn)了視頻畫面變得模糊的情況。如果你嘗試跳過尚未加載的視頻的部分,這樣的話,畫面就必須停止,以緩沖那些還沒有加載的部分。

      YouTube使用這些自適應(yīng)的比特率(ABR)算法,試圖給用戶提供更一致的觀看體驗(yàn)。他們也節(jié)省了帶寬,因?yàn)槿藗兺ǔ2粫?huì)一直從頭到尾觀看視頻。因此,如果一直為所有用戶都提供成千上萬個(gè)時(shí)長(zhǎng)較長(zhǎng)視頻的緩沖,其實(shí)是一個(gè)巨大的浪費(fèi)資源。

      雖然ABR算法已經(jīng)做得很不錯(cuò)了,但觀眾對(duì)流媒體視頻的期望卻在不斷增長(zhǎng),而且在像Netflix和YouTube這樣的網(wǎng)站不得不在視頻質(zhì)量和緩沖的頻率之間做出不完美的權(quán)衡時(shí),觀眾的日益增長(zhǎng)的期望越來越不能被滿足。

      MIT的教授Mohammad Alizadeh表示:“研究表明,如果質(zhì)量太低,用戶就會(huì)放觀看視頻,從而導(dǎo)致內(nèi)容提供商的廣告收入出現(xiàn)重大損失。因此,視頻網(wǎng)站必須不斷尋找創(chuàng)新的新方法。”

      在這些方面,Alizadeh和他在MIT計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(CSAIL)的團(tuán)隊(duì)已經(jīng)開發(fā)出了“Pensieve”這樣一個(gè)AI系統(tǒng)。它使用機(jī)器學(xué)習(xí)根據(jù)網(wǎng)絡(luò)條件選擇不同的算法。它已經(jīng)被證明了能夠比現(xiàn)有的系統(tǒng)提供更高質(zhì)量的視頻觀看體驗(yàn)。

      具體地說,在實(shí)驗(yàn)中,研究小組發(fā)現(xiàn),Pensieve可以比其他方法更少地減少10%到30%的緩沖,而用戶在“體驗(yàn)質(zhì)量”(QoE)指標(biāo)上的評(píng)分則要高出10%到25%。

      Pensieve也可以根據(jù)內(nèi)容提供者的優(yōu)先級(jí)進(jìn)行定制。例如,如果一個(gè)在地鐵上的用戶即將進(jìn)入一個(gè)沒有網(wǎng)絡(luò)的區(qū)域,YouTube可以關(guān)閉比特率,這樣它就可以加載足夠的視頻,這樣它就不會(huì)在沒有網(wǎng)絡(luò)的區(qū)域出現(xiàn)緩沖停頓的畫面。

      “我們的系統(tǒng)對(duì)你想要優(yōu)化它的任何東西都是靈活的,”博士生Hongzi Mao表示。他相關(guān)論文的第一作者,同署名的還有Alizadeh和博士生Ravi Netravali。“你甚至可以想象為單個(gè)用戶定制的個(gè)性化視頻體驗(yàn),基于他們是否想要將不要緩沖的優(yōu)先級(jí)設(shè)置為高于分辨率。

      這篇論文將于下周在洛杉磯召開的SIGCOMM會(huì)議上進(jìn)行講演。團(tuán)隊(duì)也會(huì)在那個(gè)時(shí)候?qū)Υa進(jìn)行開源。

      論文地址

      ABR是如何工作的

      廣義地說,有ABR算法有兩種:

      1)rate-based的算法,衡量網(wǎng)絡(luò)傳輸數(shù)據(jù)的速度;

      2)buffer-based的算法,確保一定數(shù)量的視頻已經(jīng)被緩沖了。

      這兩種類型都受到一定的限制,因?yàn)樗鼈儧]有同時(shí)使用關(guān)于速率和緩沖的信息。因此,這些算法通常會(huì)做出糟糕的比特率決策,并需要由人類專家進(jìn)行仔細(xì)的手工調(diào)整,以適應(yīng)不同的網(wǎng)絡(luò)環(huán)境。

      研究人員還試圖將這兩種方法結(jié)合起來:CMU的研究人員開發(fā)了“模型預(yù)測(cè)控制”(MPC)系統(tǒng),該方法旨在通過預(yù)測(cè)條件如何隨時(shí)間演變來優(yōu)化決策。這是一個(gè)重大的提升,但仍然存在著網(wǎng)絡(luò)速度等因素難以建模的問題。

      “建模網(wǎng)絡(luò)動(dòng)力是很困難的。即使有了像MPC這樣的方法,你最終只會(huì)和你的模型一樣好。”Alizadeh表示。

      Pensieve并不需要一個(gè)模型,也不需要任何像網(wǎng)絡(luò)速度這樣的現(xiàn)有假設(shè)。它表現(xiàn)為一個(gè)神經(jīng)網(wǎng)絡(luò)式的ABR算法,并在有廣泛緩沖和網(wǎng)絡(luò)速度條件的情況下反復(fù)進(jìn)行測(cè)試。

      該系統(tǒng)通過獎(jiǎng)勵(lì)和懲罰系統(tǒng)來調(diào)整算法。例如,它可以得到一個(gè)獎(jiǎng)勵(lì),如果用戶得到了高分辨率體驗(yàn),但是如果它停下來緩沖的話,就會(huì)受到懲罰。

      “它會(huì)了解不同的戰(zhàn)略對(duì)績(jī)效的影響,而且,通過觀察過去的實(shí)際表現(xiàn),它可以以一種更加穩(wěn)健的方式改善決策體系。”這篇論文的第一作者M(jìn)ao表示。

      像YouTube這樣的內(nèi)容提供商可以根據(jù)他們想要為用戶設(shè)定優(yōu)先級(jí)的標(biāo)準(zhǔn)來定制Pensieve的獎(jiǎng)勵(lì)系統(tǒng)。例如,研究表明,在視頻前期,觀眾更容易接受緩沖,因此該算法可以將緩沖的懲罰調(diào)整到一個(gè)更大的度上。

      將機(jī)器學(xué)習(xí)與深度學(xué)習(xí)技術(shù)相結(jié)合

      該團(tuán)隊(duì)在幾個(gè)場(chǎng)合測(cè)試了Pensieve,包括在咖啡館使用Wifi和在街上行走時(shí)使用LTE網(wǎng)絡(luò)。實(shí)驗(yàn)表明,Pensieve可以實(shí)現(xiàn)與MPC相同的視頻分辨率,但緩沖卻減少了10%到30%。

      CMU電子和計(jì)算機(jī)工程助理教授Vyaz Sekar表示:“以前的方法試圖使用基于人類專家直覺的控制邏輯。”這項(xiàng)工作展示了機(jī)器學(xué)習(xí)方法的前景。

      Mao表示,研究小組的實(shí)驗(yàn)表明,即使在以前從未見過的情況下,Pensieve也能很好地工作。

      他說:“當(dāng)我們?cè)?lsquo;boot camp’中使用綜合數(shù)據(jù)測(cè)試的時(shí)候,它發(fā)現(xiàn)了ABR算法對(duì)真實(shí)的網(wǎng)絡(luò)來說足夠強(qiáng)大。這種壓力測(cè)試表明,它對(duì)于現(xiàn)實(shí)世界中的新場(chǎng)景擁有不俗的表現(xiàn)。”

      Alizadeh還指出,Pensive僅僅接受了一個(gè)月的下載視頻的訓(xùn)練。如果該團(tuán)隊(duì)擁有Netflix或YouTube規(guī)模數(shù)據(jù),他說他預(yù)計(jì)Pensieve的表現(xiàn)將會(huì)有更大的提升。

      接下來,他的團(tuán)隊(duì)將在虛擬現(xiàn)實(shí)(VR)視頻中測(cè)試Pensieve。

      本文轉(zhuǎn)自微信公眾號(hào)“將門創(chuàng)投”(ID:thejiangmen),來源:news.mit.edu。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。