5G確定性工業(yè)基站首商用,工業(yè)互聯(lián)網走上新高度李飛飛團隊前瞻性研究 多模態(tài)AI模型初顯空間智能AI終于邁過這道檻!Livekit 開源模型精準識別“你是否說完”!DeepSeek開源大模型開發(fā)者之一羅福莉將加盟小米廣汽詳解旗下首款復合翼飛行汽車 GOVY AirJet:最高飛行速度可達 250km/h清華大學聯(lián)合騰訊出品!ColorFlow:自動給黑白漫畫上色,保持角色一致性Adobe推新AI音頻具Sketch2Sound ,只需哼唱和模仿聲音就能創(chuàng)建音效家庭能源智聯(lián)自由 海辰儲能發(fā)布首套免安裝家庭微網系統(tǒng)HeroESOpenAI發(fā)布o3:AI 推理能力的重大突破,得分高達87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團外賣出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動6000億GTV后,抖音計劃偷襲美團大本營AGI Open Network(AON):賦能每個人創(chuàng)建、部署和貨幣化AI Agent貸款利率史上最低了嗎?東融教你看懂歷年啥水平“客服來電”有詐?抖音客服上線“驗證助手”助用戶識別詐騙OpenAI新模型GPT-5研發(fā)未達預期:成本高昂 效果不佳曝天馬打入果鏈:為蘋果HomePod供應LCD屏 每塊屏僅10美元曝OPPO或首發(fā)新款天璣次旗艦芯片 兩大子品牌Q2發(fā)力諾基亞攜手阿聯(lián)酋運營商e&,展示全球首個固網游戲端到端網絡切片方案
  • 首頁 > 云計算頻道 > 大模型

    騰訊推全新圖生視頻模型Follow-Your-Pose-v2 可生成多人運動視頻

    2024年06月11日 15:27:03   來源:站長之家

      騰訊混元團隊聯(lián)合中山大學、香港科技大學推出了一款全新的圖生視頻模型,名為"Follow-Your-Pose-v2"。這一模型在視頻生成領域實現(xiàn)了從單人到多人的跨越,能夠處理人物合照,讓所有人都能同時在視頻中動起來。

      主要亮點:

      支持多人視頻動作生成:在推理耗時更少的情況下,實現(xiàn)多人視頻動作的生成。

      強泛化能力:無論年齡、服裝、人種、背景雜亂程度或動作復雜性如何,都能生成高質量視頻。

      日常生活照/視頻可用:模型訓練及生成可以使用日常生活照(包括抓拍)或視頻,無需尋找高質量圖片/視頻。

      正確處理人物遮擋:面對單張圖片上多個人物軀體相互遮擋的問題,能生成具有正確前后關系的遮擋畫面。

      技術實現(xiàn)方面:

      模型利用"光流指導器"引入背景光流信息,即使在相機抖動或背景不穩(wěn)定的情況下,也能生成穩(wěn)定背景動畫。

      通過"推理圖指導器"和"深度圖指導器",模型能更好地理解圖片中的人物空間信息和多角色的空間位置關系,有效解決多角色動畫和身體遮擋問題。

      評估與比較:

      團隊提出了一個新的基準Multi-Character,包含約4000幀多角色視頻,用以評估多角色生成效果。

      實驗結果顯示,"Follow-Your-Pose-v2"在兩個公共數(shù)據(jù)集(TikTok和TED演講)和7個指標上的性能均優(yōu)于最新技術35%以上。

      應用前景:

      圖像到視頻生成技術在電影內容制作、增強現(xiàn)實、游戲制作及廣告等多個行業(yè)有著廣泛的應用前景,是2024年備受關注的AI技術之一。

      其他信息:

      騰訊混元團隊還公布了文生圖開源大模型(混元DiT)的加速庫,大幅提升推理效率,生圖時間縮短75%。

      混元DiT模型的使用門檻降低,用戶可以在Hugging Face的官方模型庫中用三行代碼調用模型。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網大會——工業(yè)互聯(lián)網標識解析專題論壇在沈陽成功舉辦。