OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡體驗電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應,強者恒強?——《中國企業(yè)科創(chuàng)力研究報告(2024)》美團年度報告竟然用上了AI和短?這下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術(shù)分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級自動泊車/接駕等多項功能華為官方翻新手機最高降價4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內(nèi)置自研W-Fi芯片李斌回應螢火蟲外觀設計:看過實車的人都喜歡這個設計林杰:未來 A 級、A0 級、A00 級車型都將是領(lǐng)克純電的“主場”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設與智慧出行萬象分區(qū)、絢彩XDR、量子點Pro 2025齊出手,TCL引領(lǐng)觀影體驗新變革!QQ音樂年度聽歌報告發(fā)布:誰是你最喜歡的歌手?OpenAI正式發(fā)布o3 - 通往AGI的路上,已經(jīng)沒有了任何阻礙「送禮物」難撬動社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁技術(shù)報告出爐2024年結(jié)束,哪里是原創(chuàng)動畫的應許之地?深扒一個正被游戲行業(yè)「搶占」的流量帝國
  • 首頁 > 云計算頻道 > 大模型

    Adobe 發(fā)布 VideoGigaGAN 超分辨率視頻模型

    2024年06月04日 10:00:14   來源:站長之家

      全球多媒體巨頭 Adobe 與馬里蘭大學的研究人員合作推出了新的超分辨率視頻模型 VideoGigaGAN。該模型兼顧幀率連貫性和豐富細節(jié),解決了當前超分辨率視頻模型的難題。

      在過去的超分辨率視頻轉(zhuǎn)換中,存在兩大難題:一是保持輸出視頻幀在時間上的連貫性,確保幀到幀之間平滑過渡,不出現(xiàn)閃爍或抖動的情況;二是在放大的視頻幀中重建高頻細節(jié),提供清晰和逼真的紋理效果。然而,目前的超分辨率視頻模型雖然在保持時間連貫性方面取得了進展,但以犧牲圖像清晰度為代價,整體模糊缺乏更加生動的細節(jié)和紋理。

      VideoGigaGAN 是基于 Adobe、卡內(nèi)基梅隆大學和浦項科技大學之前推出的大規(guī)模圖像超分辨率模型 GigaGAN 的基礎(chǔ)之上開發(fā)而成。該模型通過添加時序卷積和自注意力層,將 GigaGAN 模型從2D 圖像擴展為3D 視頻模型,同時引入了光流引導模塊,更好地對齊不同幀的特征,提高視頻的時間一致性和細節(jié)豐富性。

      時序卷積模塊使模型能夠捕捉視頻幀之間的時間依賴性,從而提高超分辨率視頻的時間一致性。自注意力層在解碼器塊中提取空間上的細節(jié)和紋理信息,同時在時間上增強一致性。光流引導模塊利用光流來預測視頻幀中的像素級運動,保持特征的空間一致性,生成清晰的超分辨率視頻。

      VideoGigaGAN 的技術(shù)原理:

      基于 GigaGAN:VideoGigaGAN 基于大規(guī)模圖像超分辨率模型 GigaGAN,通過將其擴展為視頻模型來實現(xiàn)視頻超分辨率處理。

      時域注意力:在解碼器塊中添加時域注意力層,以確保在視頻超分辨率處理過程中保持時域一致性。

      特征傳播模塊:利用特征傳播模塊來增強一致性,將特征從視頻的不同幀之間進行傳播,以保持視頻的連貫性。

      抗鋸齒處理:通過在編碼器的下采樣層中引入抗鋸齒模塊,有效抑制視頻中的鋸齒狀偽影,改善視覺效果。

      細節(jié)補償:通過直接將高頻特征通過跳躍連接傳輸?shù)浇獯a器層,以補償在模糊處理過程中丟失的細節(jié)。

      通過以上技術(shù)原理,VideoGigaGAN 能夠在視頻超分辨率處理中實現(xiàn)高質(zhì)量的細節(jié)豐富的輸出,并保持時域一致性。

      VideoGigaGAN 具有以下功能特點:

      視頻超分辨率:能夠?qū)⒌头直媛实囊曨l提升至高分辨率,增加視頻細節(jié)和清晰度。

      時域一致性:在進行視頻超分辨率處理時,能夠保持視頻的時域一致性,避免出現(xiàn)時間上的不連續(xù)或跳躍。

      豐富的細節(jié)處理:能夠處理視頻中的豐富細節(jié),包括紋理、邊緣和高頻信息,提升視頻質(zhì)量。

      抗鋸齒處理:能夠有效抑制視頻中出現(xiàn)的鋸齒狀偽影,改善視頻的視覺效果。

      通用性:能夠處理不同類型的視頻內(nèi)容,適用于多種視頻處理場景。

      高質(zhì)量輸出:生成的超分辨率視頻具有更高的質(zhì)量和清晰度,可用于多種應用領(lǐng)域。

      VideoGigaGAN 可以在多種應用場景中發(fā)揮作用,包括但不限于:

      1. 視頻內(nèi)容制作:提高視頻內(nèi)容的清晰度和細節(jié),使得視頻制作過程中可以處理低分辨率素材,并生成更高質(zhì)量的視頻作品。

      2. 視頻監(jiān)控和安全領(lǐng)域:對于監(jiān)控攝像頭捕捉的低分辨率視頻進行超分辨率處理,從而提高監(jiān)控系統(tǒng)的效能和識別能力。

      3. 視頻通訊和會議:在視頻通話和遠程會議中,對低分辨率視頻進行提升,改善視頻質(zhì)量,提升用戶體驗。

      4. 醫(yī)療影像:對于醫(yī)學圖像和視頻進行超分辨率處理,提高醫(yī)療影像的清晰度和診斷準確性。

      5. 視頻內(nèi)容分發(fā):對于在線視頻平臺或內(nèi)容提供商,可以使用 VideoGigaGAN 提高視頻質(zhì)量,提供更清晰的視頻內(nèi)容給用戶。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。