就在剛剛,PixVerse的v4版本上線了。
他們AI視頻的模型能力,又一次迎來了飛躍。
2025年后的第一波AI視頻的開卷來得比想象中要快,前腳OmniHuman-1剛出,緊接著PixVerse就迎來了新模型的更新。
而我5天前就拿到了體驗資格,整體測下來,我的評價是:不管是文生圖生還是新玩法都肉眼可見的進步不少,底層模型能力有了質(zhì)的飛躍。
話不多說,直接上我測試的一些case。
文生:
1. 提示詞:龍卷風(fēng),高速移動,緊張刺激,城市公路上一輛80年代的橙色復(fù)古跑車高速前進、漂移。災(zāi)難電影氛圍。
2.提示詞:空靈的雄鹿,身體由銀色的霧氣構(gòu)成,在月光下閃爍著微弱的光芒。它的鹿角上裝飾著浮動的光球,行動悄無聲息,身后留下閃閃發(fā)光的霧跡。
3.提示詞:時空扭曲躍遷序列:應(yīng)用愛因斯坦場方程模擬時空彎曲,相機沿克爾黑洞視界面運動,激活時間膨脹視覺效果。在躍遷點設(shè)置時空奇點,引入彭羅斯圖解算法計算光錐變形(扭曲系數(shù)145%)
而且這波PixVerse v4對于科幻硬核物理效果的支持,我只能說,太帥了。
還有一個我的好朋友@齊馬橙 做的視頻case,也超帥。
這個視頻的Prompt是這樣的:超球面維度躍遷鏡頭:11維空間投影運鏡,使用黎曼流形軌跡算法,在維度坍縮時激活拓撲缺陷視覺預(yù)警系統(tǒng)。
雖然里面出現(xiàn)了文字,但是在我的測試下發(fā)現(xiàn),文字的生成并不是特別可控。文生視頻能出現(xiàn),但是圖生視頻不太行,并且目前只支持英文。
再看圖生:
1. prompt:大風(fēng)天氣,女人凝視鏡頭,遠處的田野火焰蔓延。鏡頭推近,Zoom in。女人露出詭異的微笑。
2.prompt:機械女武士用手捂住眼睛。放下手,眼睛變成紅色。站起來直視鏡頭?苹秒娪帮L(fēng)格。鏡頭拉遠,Zoom Out。
語義理解和人物一致性強的沒話說。
PixVerse的對物理規(guī)律理解的表現(xiàn)進步也很大。
真實感非常強。
比如這個《某種物質(zhì)》里面的經(jīng)典鏡頭。
融合過程自然,也沒有出現(xiàn)不合理的形變。
鏡面的反光也能輕松拿捏,強的離譜。
prompt:宇航員躺在花田里,抬起手臂。然后坐起來。
除了這些,最直觀的感受就是生成速度巨快,極速版在5s左右就能出來,效率拉滿真的很爽。
整體效果測下來,V4比V3.5各個方面都強了不止一個維度,新版本的V4基模絕對是AI視頻目前穩(wěn)穩(wěn)的T1梯隊,非常非常強。
說實話,我覺得PixVerse的路走的是對的,即使他們現(xiàn)在靠著特效模板這個功能,破了N次圈,在各種中東土豪國家的AppStore榜單上登頂,但是他們從來沒有讓模型的進化速度變慢,而是迭代的速度越來越快。
V1版本的上線時間是24年1月15日,V2版本是7月24,V2.5是8月22,V3是10月29,V3.5是12月29,如今V4,是2月24。
DeepSeek爆火之后,基本整個AI圈都有了一個統(tǒng)一的共識:
“AI唯一的應(yīng)用是智能本身”
模型能力是一切的基石,你應(yīng)用上的所有功能、體驗的優(yōu)化,都是讓用戶更低門檻使用“智能”的手段,它更像一個乘以模型的系數(shù),模型能力本身是10分,疊加特效模板這種有趣的功能,乘以10就能得到一個100分的應(yīng)用。
但是如果模型能力只有1分,即使你做出來了30分的牛逼到爆的功能,最后你得到的也只是一個30分的垃圾。
AI視頻領(lǐng)域目前我覺得最典型的就是Runway,牛逼功能確實不少,比如Act-One、超級運鏡等等,但是吧,半年了模型幾乎就沒咋大動過了,在AI時代的尺度上,半年是一個啥樣的周期,懂得都懂。。。
而PixVerse我覺得就融合得很好,保持著模型的超快速度的迭代,提升模型的基礎(chǔ)能力之后,你的其他能力才有意義。
比如說V4這次一個非常亮眼的新功能:sound。
如果細心的朋友可能會發(fā)先,我前面大部分的Case都是視頻,這次沒用gif,是因為里面,都是帶有非常自然的音效的。(之所以文生那趴不是視頻是因為公眾號最多一篇文章傳10個視頻。。。)
你只需要把Sound打開,就可以自動跟你的視頻匹配音效。
當(dāng)然,你也可以自己描述,比如我寫的一段:sound prompt:寧靜的花園,清脆的鳥鳴。
而且效果我覺得非常自然,問了一下這個音效模式居然是PixVerse自己做的,我覺得比11Labs那個AI音效效果要好。
他們還有一些別的功能,什么speech(對口型)、restyle(上傳一段視頻,遷移成自己喜歡的風(fēng)格)等等,大家可以自己試試看,我就不一一列舉了。
還是那句話,底層模型牛逼了,其他疊加上的效果才有用武之地。
最后我們再看看PixVerse的看家本領(lǐng),特效模板。
他們作為這個功能的開創(chuàng)者,這玩意是不得不聊的,得益于V4模型能力的加持,模板效果感覺都比以前的要好了。
我覺得這個打架是最好玩的。。。
比如當(dāng)鮮蝦包罵我文章罵的太狠,我想要報復(fù),但現(xiàn)實中打人是違法的,我就打開kungfu特效,上傳我倆的合影,暴打他一頓。
要是實在打不過他,我就可以用Holy Wings特效直接升仙,給他來個降維打擊。
真的,太抽象了。
在天庭上還遇到了哪吒和傲丙,想起有群友對他倆嗑生嗑死,于是轉(zhuǎn)手把他倆的動漫合影放到了kiss特效里。(高能提醒+疊甲:不磕的兄弟姐妹們請溫柔劃走,我怕被打)
他兩居然還知道閉眼,好好好,這細節(jié)無敵了。
特效模板我寫過了N次了,這個功能是我非常看好的,而它在PixVerse V4的加持下,質(zhì)感和動作又上升了一個新臺階。
說到底,模型能力才是根本。
有把“智能”本身推到更高的層次,才能讓那些特效、音效、風(fēng)格遷移等功能真正爆發(fā)出魔力。
卷吧。
真的很幸運,親身參與這個大AI時代。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。