首頁 > 云計算頻道 > 大模型

剛剛，PixVerse V4正式上線，5秒出一個AI視頻還自帶AI音效

2025年02月24日 09:52:37 來源：數(shù)字生命卡茲克公眾號

　　就在剛剛，PixVerse的v4版本上線了。

　　他們AI視頻的模型能力，又一次迎來了飛躍。

　　2025年后的第一波AI視頻的開卷來得比想象中要快，前腳OmniHuman-1剛出，緊接著PixVerse就迎來了新模型的更新。

　　而我5天前就拿到了體驗資格，整體測下來，我的評價是:不管是文生圖生還是新玩法都肉眼可見的進步不少，底層模型能力有了質(zhì)的飛躍。

　　話不多說，直接上我測試的一些case。

　　文生:

　　1. 提示詞:龍卷風(fēng)，高速移動，緊張刺激，城市公路上一輛80年代的橙色復(fù)古跑車高速前進、漂移。災(zāi)難電影氛圍。

　　2.提示詞:空靈的雄鹿，身體由銀色的霧氣構(gòu)成，在月光下閃爍著微弱的光芒。它的鹿角上裝飾著浮動的光球，行動悄無聲息，身后留下閃閃發(fā)光的霧跡。

　　3.提示詞:時空扭曲躍遷序列:應(yīng)用愛因斯坦場方程模擬時空彎曲，相機沿克爾黑洞視界面運動，激活時間膨脹視覺效果。在躍遷點設(shè)置時空奇點，引入彭羅斯圖解算法計算光錐變形(扭曲系數(shù)145%)

　　而且這波PixVerse v4對于科幻硬核物理效果的支持，我只能說，太帥了。

　　還有一個我的好朋友@齊馬橙做的視頻case，也超帥。

　　這個視頻的Prompt是這樣的:超球面維度躍遷鏡頭:11維空間投影運鏡，使用黎曼流形軌跡算法，在維度坍縮時激活拓撲缺陷視覺預(yù)警系統(tǒng)。

　　雖然里面出現(xiàn)了文字，但是在我的測試下發(fā)現(xiàn)，文字的生成并不是特別可控。文生視頻能出現(xiàn)，但是圖生視頻不太行，并且目前只支持英文。

　　再看圖生:

　　1. prompt:大風(fēng)天氣，女人凝視鏡頭，遠處的田野火焰蔓延。鏡頭推近，Zoom in。女人露出詭異的微笑。

　　2.prompt:機械女武士用手捂住眼睛。放下手，眼睛變成紅色。站起來直視鏡頭�？苹秒娪帮L(fēng)格。鏡頭拉遠，Zoom Out。

　　語義理解和人物一致性強的沒話說。

　　PixVerse的對物理規(guī)律理解的表現(xiàn)進步也很大。

　　真實感非常強。

　　比如這個《某種物質(zhì)》里面的經(jīng)典鏡頭。

　　融合過程自然，也沒有出現(xiàn)不合理的形變。

　　鏡面的反光也能輕松拿捏，強的離譜。

　　prompt:宇航員躺在花田里，抬起手臂。然后坐起來。

　　除了這些，最直觀的感受就是生成速度巨快，極速版在5s左右就能出來，效率拉滿真的很爽。

　　整體效果測下來，V4比V3.5各個方面都強了不止一個維度，新版本的V4基模絕對是AI視頻目前穩(wěn)穩(wěn)的T1梯隊，非常非常強。

　　說實話，我覺得PixVerse的路走的是對的，即使他們現(xiàn)在靠著特效模板這個功能，破了N次圈，在各種中東土豪國家的AppStore榜單上登頂，但是他們從來沒有讓模型的進化速度變慢，而是迭代的速度越來越快。

　　V1版本的上線時間是24年1月15日，V2版本是7月24，V2.5是8月22，V3是10月29，V3.5是12月29，如今V4，是2月24。

　　DeepSeek爆火之后，基本整個AI圈都有了一個統(tǒng)一的共識:

　　“AI唯一的應(yīng)用是智能本身”

　　模型能力是一切的基石，你應(yīng)用上的所有功能、體驗的優(yōu)化，都是讓用戶更低門檻使用“智能”的手段，它更像一個乘以模型的系數(shù)，模型能力本身是10分，疊加特效模板這種有趣的功能，乘以10就能得到一個100分的應(yīng)用。

　　但是如果模型能力只有1分，即使你做出來了30分的牛逼到爆的功能，最后你得到的也只是一個30分的垃圾。

　　AI視頻領(lǐng)域目前我覺得最典型的就是Runway，牛逼功能確實不少，比如Act-One、超級運鏡等等，但是吧，半年了模型幾乎就沒咋大動過了，在AI時代的尺度上，半年是一個啥樣的周期，懂得都懂。。。

　　而PixVerse我覺得就融合得很好，保持著模型的超快速度的迭代，提升模型的基礎(chǔ)能力之后，你的其他能力才有意義。

　　比如說V4這次一個非常亮眼的新功能:sound。

　　如果細心的朋友可能會發(fā)先，我前面大部分的Case都是視頻，這次沒用gif，是因為里面，都是帶有非常自然的音效的。(之所以文生那趴不是視頻是因為公眾號最多一篇文章傳10個視頻。。。)

　　你只需要把Sound打開，就可以自動跟你的視頻匹配音效。

　　當(dāng)然，你也可以自己描述，比如我寫的一段:sound prompt:寧靜的花園，清脆的鳥鳴。

　　而且效果我覺得非常自然，問了一下這個音效模式居然是PixVerse自己做的，我覺得比11Labs那個AI音效效果要好。

　　他們還有一些別的功能，什么speech(對口型)、restyle(上傳一段視頻，遷移成自己喜歡的風(fēng)格)等等，大家可以自己試試看，我就不一一列舉了。

　　還是那句話，底層模型牛逼了，其他疊加上的效果才有用武之地。

　　最后我們再看看PixVerse的看家本領(lǐng)，特效模板。

　　他們作為這個功能的開創(chuàng)者，這玩意是不得不聊的，得益于V4模型能力的加持，模板效果感覺都比以前的要好了。

　　我覺得這個打架是最好玩的。。。

　　比如當(dāng)鮮蝦包罵我文章罵的太狠，我想要報復(fù)，但現(xiàn)實中打人是違法的，我就打開kungfu特效，上傳我倆的合影，暴打他一頓。

　　要是實在打不過他，我就可以用Holy Wings特效直接升仙，給他來個降維打擊。

　　真的，太抽象了。

　　在天庭上還遇到了哪吒和傲丙，想起有群友對他倆嗑生嗑死，于是轉(zhuǎn)手把他倆的動漫合影放到了kiss特效里。(高能提醒+疊甲:不磕的兄弟姐妹們請溫柔劃走，我怕被打)

　　他兩居然還知道閉眼，好好好，這細節(jié)無敵了。

　　特效模板我寫過了N次了，這個功能是我非常看好的，而它在PixVerse V4的加持下，質(zhì)感和動作又上升了一個新臺階。

　　說到底，模型能力才是根本。

　　有把“智能”本身推到更高的層次，才能讓那些特效、音效、風(fēng)格遷移等功能真正爆發(fā)出魔力。

　　卷吧。

　　真的很幸運，親身參與這個大AI時代。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信

即時

BenQ DesignVue攜新品重磅亮相「創(chuàng)意界奧斯卡」Adobe Max

2024年的Adobe MAX 2024發(fā)布會上，Adobe推出了最新版本的Adobe Creative Cloud。

銷量增速遠超預(yù)期一加手機達成春節(jié)假期全行業(yè)銷量增幅第

決戰(zhàn)性能之巔真我GT7 Pro競速版2月13日發(fā)布

感谢您访问我们的网站，您可能还对以下资源感兴趣：
台湾中文娱乐网

剛剛，PixVerse V4正式上線，5秒出一個AI視頻還自帶AI音效

即時

BenQ DesignVue攜新品重磅亮相「創(chuàng)意界奧斯卡」Adobe Max

新聞

明火炊具市場：三季度健康屬性貫穿全類目

企業(yè)IT

重慶創(chuàng)新公積金應(yīng)用，“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

3C消費

華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器，高能實力，創(chuàng)

研究

中國信通院羅松：深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

專題

剛剛，PixVerse V4正式上線，5秒出一個AI視頻還自帶AI音效

擴展閱讀

剛剛，PixVerse V4正式上線，5秒出一個AI視頻還自帶AI音效