中國銀聯(lián)旗下子公司成為國內(nèi)首家vLEI授權(quán)發(fā)行機構(gòu)跟著京東大學(xué)生開學(xué)爆款清單換新裝備 買3C數(shù)碼享國家補貼立省20%德國MR攜手成都西電中特完成首個可調(diào)式電抗器項目交付,助力卡塔爾氣田擴建AMD擬出售數(shù)據(jù)中心制造工廠,多家亞洲企業(yè)參與談判曼哈特中國攜手阿里云,加速云原生倉儲管理解決方案在華落地瑪莎拉蒂GranCabrio 490即將上市適馬發(fā)布兩款新鏡頭:300-600mm F4 DG OS Sports 和 16-300mm F3.5-6.7 DC OS Contemporary至譽科技推出入門級UHS-I SD存儲卡,支持4K 60P視頻錄制司享網(wǎng)絡(luò)亮相SAP全球運營高峰論壇,AI+公有云賦能中國企業(yè)出海新航程科技廠商們,“拒絕”DeepSeek的“獨角戲”?登頂全球應(yīng)用市場下載榜 DeepSeek為何如此爆火?京東外賣,攪動一池春水網(wǎng)易游戲延續(xù)增勢,外圍業(yè)務(wù)全線下滑,接入AI能抗老嗎?雅迪攜手代言人王鶴棣閃耀NBA全明星,“中國智造” 海外圈粉無數(shù)長劇微劇雙引擎 正在重塑愛奇藝AI推動阿里增長背后,有幾張應(yīng)用王牌?星環(huán)科技推出DeepSeek全場景解決方案:即開即用、企業(yè)級部署、端側(cè)智能三位一體大模型加速重構(gòu) AI4S正在改變科研方式阿里股價狂飆萬億,釘釘卡位AI ToB入口小鵬匯天“陸地航母”陸行體進入冬季測試階段:2026年計劃量產(chǎn)交付
  • 首頁 > 云計算頻道 > 大模型

    剛剛,PixVerse V4正式上線,5秒出一個AI視頻還自帶AI音效

    2025年02月24日 09:52:37   來源:數(shù)字生命卡茲克公眾號

      就在剛剛,PixVerse的v4版本上線了。

      他們AI視頻的模型能力,又一次迎來了飛躍。

      2025年后的第一波AI視頻的開卷來得比想象中要快,前腳OmniHuman-1剛出,緊接著PixVerse就迎來了新模型的更新。

      而我5天前就拿到了體驗資格,整體測下來,我的評價是:不管是文生圖生還是新玩法都肉眼可見的進步不少,底層模型能力有了質(zhì)的飛躍。

      話不多說,直接上我測試的一些case。

      文生:

      1. 提示詞:龍卷風(fēng),高速移動,緊張刺激,城市公路上一輛80年代的橙色復(fù)古跑車高速前進、漂移。災(zāi)難電影氛圍。

      2.提示詞:空靈的雄鹿,身體由銀色的霧氣構(gòu)成,在月光下閃爍著微弱的光芒。它的鹿角上裝飾著浮動的光球,行動悄無聲息,身后留下閃閃發(fā)光的霧跡。

      3.提示詞:時空扭曲躍遷序列:應(yīng)用愛因斯坦場方程模擬時空彎曲,相機沿克爾黑洞視界面運動,激活時間膨脹視覺效果。在躍遷點設(shè)置時空奇點,引入彭羅斯圖解算法計算光錐變形(扭曲系數(shù)145%)

      而且這波PixVerse v4對于科幻硬核物理效果的支持,我只能說,太帥了。

      還有一個我的好朋友@齊馬橙 做的視頻case,也超帥。

      這個視頻的Prompt是這樣的:超球面維度躍遷鏡頭:11維空間投影運鏡,使用黎曼流形軌跡算法,在維度坍縮時激活拓撲缺陷視覺預(yù)警系統(tǒng)。

      雖然里面出現(xiàn)了文字,但是在我的測試下發(fā)現(xiàn),文字的生成并不是特別可控。文生視頻能出現(xiàn),但是圖生視頻不太行,并且目前只支持英文。

      再看圖生:

      1. prompt:大風(fēng)天氣,女人凝視鏡頭,遠處的田野火焰蔓延。鏡頭推近,Zoom in。女人露出詭異的微笑。

      2.prompt:機械女武士用手捂住眼睛。放下手,眼睛變成紅色。站起來直視鏡頭?苹秒娪帮L(fēng)格。鏡頭拉遠,Zoom Out。

      語義理解和人物一致性強的沒話說。

      PixVerse的對物理規(guī)律理解的表現(xiàn)進步也很大。

      真實感非常強。

      比如這個《某種物質(zhì)》里面的經(jīng)典鏡頭。

      融合過程自然,也沒有出現(xiàn)不合理的形變。

      鏡面的反光也能輕松拿捏,強的離譜。

      prompt:宇航員躺在花田里,抬起手臂。然后坐起來。

      除了這些,最直觀的感受就是生成速度巨快,極速版在5s左右就能出來,效率拉滿真的很爽。

      整體效果測下來,V4比V3.5各個方面都強了不止一個維度,新版本的V4基模絕對是AI視頻目前穩(wěn)穩(wěn)的T1梯隊,非常非常強。

      說實話,我覺得PixVerse的路走的是對的,即使他們現(xiàn)在靠著特效模板這個功能,破了N次圈,在各種中東土豪國家的AppStore榜單上登頂,但是他們從來沒有讓模型的進化速度變慢,而是迭代的速度越來越快。

      V1版本的上線時間是24年1月15日,V2版本是7月24,V2.5是8月22,V3是10月29,V3.5是12月29,如今V4,是2月24。

      DeepSeek爆火之后,基本整個AI圈都有了一個統(tǒng)一的共識:

      “AI唯一的應(yīng)用是智能本身”

      模型能力是一切的基石,你應(yīng)用上的所有功能、體驗的優(yōu)化,都是讓用戶更低門檻使用“智能”的手段,它更像一個乘以模型的系數(shù),模型能力本身是10分,疊加特效模板這種有趣的功能,乘以10就能得到一個100分的應(yīng)用。

      但是如果模型能力只有1分,即使你做出來了30分的牛逼到爆的功能,最后你得到的也只是一個30分的垃圾。

      AI視頻領(lǐng)域目前我覺得最典型的就是Runway,牛逼功能確實不少,比如Act-One、超級運鏡等等,但是吧,半年了模型幾乎就沒咋大動過了,在AI時代的尺度上,半年是一個啥樣的周期,懂得都懂。。。

      而PixVerse我覺得就融合得很好,保持著模型的超快速度的迭代,提升模型的基礎(chǔ)能力之后,你的其他能力才有意義。

      比如說V4這次一個非常亮眼的新功能:sound。

      如果細心的朋友可能會發(fā)先,我前面大部分的Case都是視頻,這次沒用gif,是因為里面,都是帶有非常自然的音效的。(之所以文生那趴不是視頻是因為公眾號最多一篇文章傳10個視頻。。。)

      你只需要把Sound打開,就可以自動跟你的視頻匹配音效。

      當(dāng)然,你也可以自己描述,比如我寫的一段:sound prompt:寧靜的花園,清脆的鳥鳴。

      而且效果我覺得非常自然,問了一下這個音效模式居然是PixVerse自己做的,我覺得比11Labs那個AI音效效果要好。

      他們還有一些別的功能,什么speech(對口型)、restyle(上傳一段視頻,遷移成自己喜歡的風(fēng)格)等等,大家可以自己試試看,我就不一一列舉了。

      還是那句話,底層模型牛逼了,其他疊加上的效果才有用武之地。

      最后我們再看看PixVerse的看家本領(lǐng),特效模板。

      他們作為這個功能的開創(chuàng)者,這玩意是不得不聊的,得益于V4模型能力的加持,模板效果感覺都比以前的要好了。

      我覺得這個打架是最好玩的。。。

      比如當(dāng)鮮蝦包罵我文章罵的太狠,我想要報復(fù),但現(xiàn)實中打人是違法的,我就打開kungfu特效,上傳我倆的合影,暴打他一頓。

      要是實在打不過他,我就可以用Holy Wings特效直接升仙,給他來個降維打擊。

      真的,太抽象了。

      在天庭上還遇到了哪吒和傲丙,想起有群友對他倆嗑生嗑死,于是轉(zhuǎn)手把他倆的動漫合影放到了kiss特效里。(高能提醒+疊甲:不磕的兄弟姐妹們請溫柔劃走,我怕被打)

      他兩居然還知道閉眼,好好好,這細節(jié)無敵了。

      特效模板我寫過了N次了,這個功能是我非常看好的,而它在PixVerse V4的加持下,質(zhì)感和動作又上升了一個新臺階。

      說到底,模型能力才是根本。

      有把“智能”本身推到更高的層次,才能讓那些特效、音效、風(fēng)格遷移等功能真正爆發(fā)出魔力。

      卷吧。

      真的很幸運,親身參與這個大AI時代。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。