QQ音樂(lè)年度聽(tīng)歌報(bào)告發(fā)布:誰(shuí)是你最喜歡的歌手?OpenAI正式發(fā)布o(jì)3 - 通往AGI的路上,已經(jīng)沒(méi)有了任何阻礙「送禮物」難撬動(dòng)社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學(xué)擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁(yè)技術(shù)報(bào)告出爐2024年結(jié)束,哪里是原創(chuàng)動(dòng)畫(huà)的應(yīng)許之地?深扒一個(gè)正被游戲行業(yè)「搶占」的流量帝國(guó)百思買(mǎi)重新進(jìn)軍跨境電商領(lǐng)域視頻生成大模型賽道,只是看上去擁擠GGII:預(yù)計(jì)2024年中國(guó)工業(yè)機(jī)器人全年銷(xiāo)量約30萬(wàn)臺(tái),同比下滑5%左右冰雪大世界盛大開(kāi)園,美的空調(diào)橫跨50℃打造“東北夏威夷”臺(tái)灣小土豆勇闖冰雪大世界,美的空調(diào)真暖快車(chē)成為最熱打卡點(diǎn)京東iPhone 16系列年底大放價(jià)!至高補(bǔ)貼1200元價(jià)格低過(guò)11.11新一季圓滿(mǎn)假期結(jié)伴大使出發(fā)在即 LG電子十年相伴助力溫暖傳遞中國(guó)聯(lián)通組織“魅力亞冬,與智慧同行” 主題采訪活動(dòng)“萬(wàn)象分區(qū)”引領(lǐng)電視行業(yè)新潮流,TCL這步棋下得著實(shí)漂亮!百度職業(yè)院校專(zhuān)屬項(xiàng)目“大國(guó)智匠”引領(lǐng)職業(yè)教育新范式百度大模型助力2024年碼蹄杯程序設(shè)計(jì)大賽,全國(guó)高校學(xué)子展現(xiàn)卓越編程實(shí)力碼蹄杯人物特寫(xiě):四位編程少年的追夢(mèng)之旅金倉(cāng)數(shù)據(jù)庫(kù)四項(xiàng)成果入選2024星河案例亞信科技參加2024通信產(chǎn)業(yè)大會(huì) CTO歐陽(yáng)曄博士等做主題演講
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    快手文生視頻模型可靈開(kāi)放測(cè)試 更懂物理,最長(zhǎng)可生成2分鐘視頻

    2024年06月07日 11:50:19   來(lái)源:站長(zhǎng)之家

      昨天,快手公司推出了一款名為「可靈」的全新視頻生成大模型,該模型采用了與Sora相似的技術(shù)路線,并結(jié)合了快手自研的多項(xiàng)技術(shù)創(chuàng)新。這款模型不僅能夠生成長(zhǎng)達(dá)2分鐘、30fps、1080p分辨率的超長(zhǎng)視頻,支持多種寬高比,還能模擬物理世界的特性,精準(zhǔn)建模復(fù)雜運(yùn)動(dòng)。

      亮點(diǎn):

      1、生成能力強(qiáng)大:

      支持長(zhǎng)達(dá)2分鐘的30fps高清視頻生成,分辨率高達(dá)1080p。

      支持多種寬高比,包括豎版視頻,非常適合快手的短視頻生態(tài)。

      2、運(yùn)動(dòng)和物理模擬:

      準(zhǔn)確刻畫(huà)復(fù)雜、大幅度的運(yùn)動(dòng),如公路上奔跑的老虎、宇航員在月球上行走等。

      能夠模擬物理特性,如重力、液體流動(dòng)和光學(xué)反射等,生成的畫(huà)面更符合真實(shí)物理規(guī)律。

      3、應(yīng)用場(chǎng)景廣泛:

      從娛樂(lè)到教育,可靈的應(yīng)用場(chǎng)景廣泛。

      支持文本轉(zhuǎn)視頻、多種控制信息輸入、以及豐富的內(nèi)容控制能力。

      「可靈」大模型夠準(zhǔn)確刻畫(huà)復(fù)雜、大幅度的時(shí)空運(yùn)動(dòng),如公路上高速奔跑的老虎,畫(huà)面連貫,動(dòng)作協(xié)調(diào),甚至奔跑過(guò)程中軀干的抖動(dòng)也得到了細(xì)致展現(xiàn)。它還能模擬真實(shí)物理世界的特性,比如倒牛奶時(shí)的重力規(guī)律和液面上升,以及光學(xué)上的反射規(guī)律。此外,「可靈」還能真實(shí)反映與真實(shí)物理世界的交互,如小男孩吃漢堡時(shí)齒印的變化等。

      技術(shù)特點(diǎn)

      1、原生視頻生成技術(shù):

      采用類(lèi)似Sora的DiT結(jié)構(gòu),用Transformer代替?zhèn)鹘y(tǒng)的卷積網(wǎng)絡(luò)U-Net。

      3D VAE網(wǎng)絡(luò)用于時(shí)空同步壓縮,提高重建質(zhì)量和訓(xùn)練性能。

      3D Attention機(jī)制用于時(shí)空建模,提升復(fù)雜時(shí)空運(yùn)動(dòng)的建模能力。

      2、高質(zhì)量數(shù)據(jù)支持:

      構(gòu)建了完備的標(biāo)簽體系,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行精細(xì)化篩選和分布調(diào)整。

      專(zhuān)用的視頻描述模型生成精確、詳盡的結(jié)構(gòu)化視頻描述,提升模型的文本指令響應(yīng)能力。

      3、高效訓(xùn)練策略:

      使用分布式訓(xùn)練集群和優(yōu)化策略提高運(yùn)算效率。

      分階段訓(xùn)練策略:初期低分辨率階段側(cè)重?cái)?shù)量,后期高分辨率階段側(cè)重質(zhì)量,確保模型在各階段的優(yōu)化。

      實(shí)際應(yīng)用

      1、快影APP:

      可靈大模型已在快影APP中開(kāi)啟邀測(cè),當(dāng)前版本支持生成720P視頻,豎版視頻生成能力即將開(kāi)放。

      2、其他應(yīng)用:

      “AI舞王”:上傳全身照,生成人物跟隨音樂(lè)跳舞的視頻。

      “AI唱跳”:生成跳舞并唱歌的視頻。

      未來(lái)還將推出圖生視頻功能。

      快手在大模型技術(shù)方面動(dòng)作迅速,與多個(gè)高;蚩蒲袡C(jī)構(gòu)合作發(fā)布了多項(xiàng)關(guān)鍵技術(shù),為「可靈」大模型積累了深厚的技術(shù)沉淀,F(xiàn)在,快手的文生視頻功能已正式亮相,期待其在短視頻場(chǎng)景中的應(yīng)用落地。

      對(duì)AI視頻創(chuàng)作感興趣的用戶(hù),可以在快影APP中體驗(yàn)「可靈」大模型的功能。

      體驗(yàn)方法:快影 APP-AI 玩法-AI 視頻生成中申請(qǐng)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類(lèi)目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性?xún)r(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專(zhuān)題論壇在沈陽(yáng)成功舉辦。