• 國產(chǎn)AI「快」到火爆外網(wǎng)!10秒生成一個視頻,網(wǎng)友:我見過最快的AI

    2025年01月16日 09:35:00   來源:量子位公眾號

      快,著實是有點太快了。

      就在這兩天,一個國產(chǎn) Sora,因為生成視頻速度太快,在外網(wǎng)火了一把。

      話不多說,我們直接來感受一下這種 speed:

      網(wǎng)友們看完直呼:

      這可能是最快的視頻生成 AI

      這款震驚外國人的視頻模型,正是生數(shù)科技最新發(fā)布的Vidu2.0

      在剛才我們展示的案例,是一個時長為4秒、分辨率為512p 的圖生視頻;而 Vidu2.0極致生成速度比之前版本又有了進一步提升,從30秒到10秒,提升了三倍。

      這次 Vidu2.0官方說法是“最快10秒”,但實測下來發(fā)現(xiàn)官方還謙虛了,刨去等待時間生成部分最快僅需5秒。

      再來感受下海外網(wǎng)友測試的不同分辨率下,輸入首、尾兩幀時視頻生成的速度:

      Vidu2.0可以說是跟其它產(chǎn)品在速度上明顯拉開了差距;甚至網(wǎng)友們在X上已經(jīng)開始打起了#viduspeed的標簽。

      但這還沒完。

      Vidu2.0不僅是在速度上來了個“拔高”,還把價格給狠狠地打了下去。

      現(xiàn)在,每秒視頻生成的成本,可以是4分錢(0.04475元/s)!

      (積分單價 = 單月價格179元 /4000積分 =0.4475元/分,按 Vidu2.0-4s-512模型來算 ,一次生成抵扣4積分,因此每秒單價:1s =1積分=0.04475元)

      如果按照行業(yè)普遍的標準來看,即720p 每秒視頻的價格,Vidu2.0直接來了個“腰斬”

      行業(yè)平均價格:0.6048元/s

      (同樣,按照上述積分成本來換算國內(nèi)外同類產(chǎn)品最低版本標準套餐每秒單價,之后再計算這些產(chǎn)品的平均價格得出為每秒0.6048元)

      Vidu2.0價格:0.2587元/s

      (Vidu 國內(nèi)基礎版包月套餐單月價格為69元,套餐額度為800分,積分單價為0.08625元,按 Vidu2.0-4s-720p 模型來計算,一次生成抵扣積分為12積分,每秒消耗積分12/4=3分,因此1s720p 視頻生成價格為0.086253=0.25875元)

      再換個角度來看,10元錢在 Vidu2.0這里,按照專業(yè)版本(國內(nèi)最低單價套餐)算的話,可以生成3分40秒512p 的視頻,或者1分14秒720p 的視頻。

      而且效果還是大片兒既視感的哦:

      網(wǎng)友用 Vidu2.0生成的《閃電俠》

      但同樣是10塊錢,Sora 只能生成13秒480p 的視頻素材。

      總而言之,Vidu2.0總結(jié)起來就是三個字——、、。

      而上一次國產(chǎn)大模型在海外爆火,也是因為 DeepSeek V3的“快好省”。

      Vidu2.0是有點視頻生成界的 DeepSeek V3的感覺了。

      真·秒生成,效果穩(wěn)得一批

      速度快、價格便宜固然重要,但畢竟生成式 AI 嘛,還是得看最終的效果如何。

      從用戶反饋看,Vidu2.0的效果很能打。

      海外用戶 @Naegiko | AI Animator 在 X 上發(fā)布基于 Vidu2.0制作的動漫短片,并給出詳細測評反饋:

      包括 Vidu2.0發(fā)布前的一波預熱視頻,也是把畫面質(zhì)量拉上了新高度。

      比如賽車這支視頻,畫面動態(tài)性、流暢度極高。

      ViduAI,贊155

      還有動漫的這支視頻,打斗場面是真的能打起來,網(wǎng)友看完更是評論:“振興國漫有望了”。

      ViduAI,贊186

      當然讓我們還是要看看 Vidu2.0實際的效果如何。我們就從多角度來一波深度實測。

      首先夸一波,Vidu2.0的操作界面可以說是非常的簡潔,在登錄官網(wǎng)之后,選擇立即體驗,就直接來到了生成界面,各種功能一目了然:

      模型版本:有 Vidu1.0、Vidu1.5和 Vidu2.0三個版本(我們選擇2.0)

      生成方式:文生視頻、圖生視頻和參考生視頻

      設置:包括風格、時長、清晰度、運動幅度和寬高比等

      我們實測的主要核心指標,就是各種維度的一致性了,看看 Vidu2.0在又快又便宜的情況下,是否會出現(xiàn)鬼畜的情況。

      人物不會發(fā)生畸變

      我們第一輪測試的主體,是人物的特寫,采取的方式是圖生視頻(只輸入首幀),圖片如下:

      然后 Prompt 如下:

      女生慢慢流下眼淚,藍色液體慢慢蕩漾起來,鏡頭拉近拍攝,電影質(zhì)感的畫面效果。

      從生成效果來看,是有種電影特寫鏡頭的感覺,水的波光在人物臉上泛起波光片影,藍色眼淚緩緩流下來的細節(jié)也非常到位。

      首尾幀風格差很多也能 hold 住

      在剛才的測試中,我們只設置了首幀的圖片,這一次我們再加上尾幀,并且特意設置兩者的風格會有較大的區(qū)別的兩張圖片。

      首幀我們上傳的是馬斯克的人物寫實照片,而尾幀的圖片則是漫畫風的鋼鐵俠。

      選擇生成720p 視頻,我們的 Prompt 是這樣的:

      馬斯克慢慢擺出鋼鐵俠的動作,與此同時,身上和頭上的盔甲慢慢裝備到身上。

      可以看到,馬斯克先是張開雙臂擺出了尾幀鋼鐵俠的 pose,然后從西服慢慢破繭而出,盔甲也是從手開始慢慢裝備到了身上,頗有點蝙蝠俠變身的既視感。

      風格也能一直保持住

      除了人物的一致性之外,視頻在生成過程中,能夠全程保持一致的風格也是能否在真實生產(chǎn)場景中可用非常重要的指標。

      因此,為了能夠更好地體現(xiàn) Vidu2.0的這一特點,我們還邀請了其他主流“選手”參與,效果如下所示:

      從對比效果來看,除了 Vidu2.0之外,其余選手都沒能固定住油畫的風格,有的甚至直接開始大變活人。

      在另一個組水墨風格的比較中,亦是如此:

      嗯,風格一致性這一塊,Vidu2.0是狠狠地穩(wěn)住了。

      多圖還能做個短片

      這里不得不提的是,Vidu 是 AI 視頻生成領域多個名詞的新創(chuàng)者,推出了多個全球首發(fā)。

      去年Vidu發(fā)布的參考生視頻,也就是如今我們熟知的“多主體一致性功能”已經(jīng)成為行業(yè)統(tǒng)稱。

      針對參考生視頻,你可以根據(jù)幾張圖,來生成一個較有故事性的視頻。

      據(jù)了解目前 Vidu 服務了超過200個國家和地區(qū),海外用戶占比超過了90%。

      而隨著2.0版本的到來,Vidu 參考生視頻的性能也得到了加強。

      這一次,我們準備了下面三張圖片來做一個短片:

      然后短片的 Prompt 是這樣的:

      圣誕老人和熊在湖邊玩耍

      一個可愛的圣誕老人與憨憨熊玩雪的動畫短劇,就這么水靈靈地誕生了!

      當然你也可以把照片換成你自己或者你的朋友、偶像、寵物,從古代到現(xiàn)代都市,從歐洲到非洲,你可以在任何場景上演大片,你就是你自己的主角也是你短片的導演,過足戲癮。

      值得一提的是,Vidu2.0還上了“薅羊毛”專屬功能,如果你不著急生成視頻,而且不想消耗積分——

      錯峰模式,了解一下。

      當你提交視頻生成任務后,它不會立刻搶占高峰流量,而是乖乖排隊,等到網(wǎng)絡流量的低谷時段再開工。

      這就意味著你可以不花任何積分,就能批量產(chǎn)出海量的視頻素材,真的算是大大的薅羊毛了。

      處理速度較快只是它外在呈現(xiàn)出的一個優(yōu)勢側(cè)面,整體來看,Vidu 的一大突出特點,在于其模型具備扎實的底層能力。

      這一基礎支撐起了相對優(yōu)越的產(chǎn)品敘事表現(xiàn)以及動態(tài)維持一致性等綜合能力,也給了專業(yè)非專業(yè)用戶更多自由發(fā)揮空間。

      人人皆可自導視頻已經(jīng)到來

      Vidu2.0的發(fā)布,到底帶來了什么?

      首先,從AI視頻生成技術(shù)發(fā)展上來看,Vidu2.0可以說是打破了一個“不可能魔咒”。

      也就是既能做到生成速度快,又能做到效果好,還能做到價格便宜。

      因為要在 AI 視頻模型要在速度、效果和成本之間取得平衡,會涉及計算資源、算法優(yōu)化、數(shù)據(jù)處理、模型壓縮等多方面的挑戰(zhàn)。

      例如質(zhì)量和速度上的矛盾是,提升質(zhì)量通常意味著使用更復雜的模型,但更復雜的模型會導致生成速度降低。

      雖然生數(shù)科技目前并沒有公布詳盡的技術(shù)報告,但想必在訓練、推理的方法,以及算法等層面定然是做了大量的創(chuàng)新工作。

      而隨著這個“魔咒”的打破,可以說現(xiàn)在已經(jīng)步入“商業(yè)廣告片百元”階段,而這同時也意味著“人人皆可生成視頻”的時代到來。

      以制作1分鐘的廣告短片為例來具體剖析。

      在傳統(tǒng)制作模式下,廣告片制作流程繁雜,涵蓋平面拍攝、動效制作以及剪輯等諸多環(huán)節(jié),相應地,人員配置要求頗高,需招攬攝影師、剪輯師、特效師等專業(yè)人才。

      哪怕只是組建一個4-5人的小型制作團隊,按照市面上普通的出品水準來衡量,制作1分鐘廣告片的行業(yè)平均成本,起碼也要達到3000-5000元區(qū)間。

      反觀運用 Vidu2.0進行創(chuàng)作,生成1分鐘商業(yè)廣告片素材所耗費的成本僅在3-5元上下。

      即便將素材的有效利用率,以及后期剪輯、配音等額外成本因素考慮在內(nèi),綜合下來,制作1分鐘廣告片的總成本也不過100元左右。

      如此對比,相較于傳統(tǒng)廣告制作方式,采用 Vidu2.0制作的成本降幅極為顯著,足足下降了30-50倍之多。同時僅需5分鐘就能生成1分鐘時長的視頻素材,節(jié)省了90% 的后期制作環(huán)節(jié)。

      在此基礎之上,便引申出了另一個問題:AI 視頻生成,到底可不可行?

      對于這一點,其實從幾個維度來看便可以清晰可知。

      首先就是用戶的認可。

      此次隨著 Vidu2.0的發(fā)布,Vidu 還首次公開了于2024年7月底全球上線以來的運營數(shù)據(jù):

      僅用了20天用戶數(shù)就突破百萬,上線100天用戶數(shù)就突破千萬,增速全球第一。

      截至目前,平臺生成視頻數(shù)量突破1億條。

      尤其是全球首發(fā)僅3個月的“參考生視頻”功能,視頻數(shù)量已經(jīng)達到了千萬級。

      由此可見,Vidu 這款產(chǎn)品已經(jīng)得到了全球用戶的廣泛認可,并且從社交平臺(如 X)上的評價來看,也是清一色的好評。

      其次還有行業(yè)的認可。

      據(jù)了解,Vidu 的產(chǎn)品還贏得了眾多國內(nèi)出海企業(yè)的青睞。

      以 Evoke(一款面向海外市場的 AI 圖生視頻應用)為例,它是 Vidu 早期的 MaaS 客戶之一。

      在接入 Vidu 的 API 之后,Evoke 的數(shù)據(jù)顯示,在特定場景的視頻生成中,Vidu 的模型準確率相比同類視頻生成平臺提升了超過60%,視頻生成時間從270秒大幅縮短至35秒,效率提升了近90%。

      那么對于這樣又快、又穩(wěn)、又便宜的 AI 視頻生成產(chǎn)品,你是否也想體驗一番呢?

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。