還能再漲23%!AI寵兒NVIDIA成大摩明年首選AMD FSR 4.0將與RX 9070 XT顯卡同步登場羅永浩細(xì)紅線最新進展,暫別AR,迎來AI Jarvis構(gòu)建堅實數(shù)據(jù)地基,南京打造可信數(shù)據(jù)空間引領(lǐng)數(shù)字城市建設(shè)下單前先比價不花冤枉錢 同款圖書京東價低于抖音6折日媒感慨中國電動汽車/智駕遙遙領(lǐng)先:本田、日產(chǎn)、三菱合并也沒戲消委會吹風(fēng)機品質(zhì)檢測結(jié)果揭曉 徠芬獨占鰲頭 共話新質(zhì)營銷力,2024梅花數(shù)據(jù)峰會圓滿落幕索尼影像專業(yè)服務(wù) PRO Support 升級,成為會員至少需注冊 2 臺 α 全畫幅相機、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競賽:6500mAh 旗艦機+7500mAh中端機寶馬M8雙門轎跑車明年年初將停產(chǎn),后續(xù)無2026款車型比亞迪:2025 款漢家族車型城市領(lǐng)航智駕功能開啟內(nèi)測雷神預(yù)告2025年首次出席CES 將發(fā)布三款不同技術(shù)原理智能眼鏡realme真我全球首發(fā)聯(lián)發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計劃iQOO Z9 Turbo長續(xù)航版手機被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷量大跌:曝保時捷將重新評估電動汽車計劃來京東參與榮耀Magic7 RSR 保時捷設(shè)計預(yù)售 享365天只換不修國補期間電視迎來換機潮,最暢銷MiniLED品牌花落誰家?美團旗下微信社群團購業(yè)務(wù)“團買買”宣布年底停運消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機設(shè)備
  • 首頁 > 云計算頻道 > 大模型

    字節(jié)、快手、Vidu“打野”升級,AI視頻小步快跑

    2024年11月13日 09:03:55   來源:光錐智能公眾號

      繼9月份版本更新之后,光錐智能從生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝朋友圈獲悉,Vidu大模型將于本周再次進行版本升級,Vidu-1.5版本即將上線。

      此版本更新方向仍是重點延伸大模型的泛化能力和主體一致性問題。上一版本重點是單一主體的一致性,而最新版本則能夠理解和整合人物、物體、環(huán)境等多個概念,遵循用戶指令30秒內(nèi)生成多個主體融合的相關(guān)視頻結(jié)果,率先實現(xiàn)視頻創(chuàng)作中的多主體一致性生成。

      除Vidu外,自今年9月份以來,據(jù)不完全統(tǒng)計,包括字節(jié)旗下即夢AI、快手可靈AI、Runway、智譜清影、愛詩科技PixVerse、Pika等主流的AI視頻生成平臺,都已經(jīng)進行了版本更新。

      當(dāng)前,在爆火的AI視頻生成賽道中,大模型創(chuàng)企、互聯(lián)網(wǎng)大廠等紛紛入局,而在經(jīng)過前期各家密集進行產(chǎn)品發(fā)布階段后,如今已進入產(chǎn)品迭代升級比拼階段。

      通過各家版本更新的內(nèi)容,不難發(fā)現(xiàn),AI視頻生成大模型能力迭代的大方向,仍是生成視頻的時長、畫面的穩(wěn)定性、連續(xù)性和主體前后的一致性上。

      但與此同時,各個玩家又在實際功能應(yīng)用中,開始出現(xiàn)“分野”,各有側(cè)重,部分中小玩家也開始找到自己的細(xì)分市場。

      比如Runway最新版本中更新了可將真人面部表情精確復(fù)刻給AI角色的Act-One,以能夠?qū)崿F(xiàn)3D化的AI攝像頭控件。PixVerse則上線了各種萬圣節(jié)特效、毒液特效等。

      對此輪各AI視頻生成平臺的更新,星賢文化創(chuàng)始人、AI原創(chuàng)玄幻IP《山海奇鏡》制作人陳坤認(rèn)為:“最大的更新應(yīng)該是Act-One這種表情遷移,提供了人物表演的基礎(chǔ)可能性。”而對于人物主體的一致性和穩(wěn)定性,“有進步,但并沒有代際型進步。”

      在AI視頻創(chuàng)作者尾鰭Vicky看來,相比上半年初代產(chǎn)品,最新更新的AI視頻平臺,除了在底層模型能力上的迭代之外,在功能上也進行了更新,比如首尾針、畫質(zhì)和幀率的補足、配音等功能,“這些功能的完善,實際上是比上半年更全面。”

      如果說2024上半年,是AI視頻生成賽道的軍備競賽,那么下半年則是進入小步快跑的版本更新周期。

      而在此階段,字節(jié)和快手的交鋒仍在激烈進行中,中小廠商開始找到自己獨特賽道,而一些企業(yè)專注走海外市場,也實現(xiàn)了“國內(nèi)開花,墻外香”的效果。

      無疑,這一階段的廝殺,看似溫和,但卻實質(zhì)性的影響平臺自身的定位和未來發(fā)展的方向,以及后續(xù)用戶群體和數(shù)量規(guī)模的可持續(xù)增長。

      字節(jié)狂追,快手搶跑

      “即夢有些掉隊。”這是AI視頻生成平臺用戶給出的客觀評價。

      作為去年第一批的AI視頻生成平臺,以及字節(jié)旗下的產(chǎn)品,即夢AI的視頻生成效果一直備受使用者詬病,處于被Runway、Pika等同一批玩家吊打的狀態(tài)。

      今年6月,字節(jié)在短視頻領(lǐng)域的直接競爭對手——快手,正式在官網(wǎng)上線了“可靈”視頻生成大模型,并火速出圈。同時,越來越多AI視頻生成平臺如雨后春筍般推出,AI視頻生成賽道徹底爆火。

      在強大競爭壓力之下,作為國內(nèi)AI產(chǎn)品第一梯隊,補上視頻生成這一塊短板,已成為字節(jié)跳動面臨的當(dāng)務(wù)之急,而其奮起直追的速度也超乎想象。

      9月24日,2024火山引擎AI創(chuàng)新巡展深圳舉辦,原抖音藝術(shù)負(fù)責(zé)人陳欣然以即夢AI及剪映市場和運營負(fù)責(zé)人的身份亮相,并宣布即夢AI已經(jīng)接入了豆包最新的視頻生成模型。

      同期,字節(jié)跳動發(fā)布豆包模型家族的兩款視頻生成模型Seaweed和Pixeldance,并通過即夢 AI、火山引擎分別面向創(chuàng)作者和企業(yè)客戶小范圍邀測。

      11月8日,字節(jié)跳動旗下的AI內(nèi)容平臺即夢AI宣布,由字節(jié)跳動自研的視頻生成模型Seaweed面向平臺用戶正式開放。

      據(jù)字節(jié)跳動方面介紹,本次開放使用的豆包視頻生成模型Seaweed是該款模型的標(biāo)準(zhǔn)版,僅需60秒即能生成時長5秒的高質(zhì)量AI視頻,領(lǐng)先國內(nèi)業(yè)界3至5分鐘的所需生成時間。

      即夢AI還透露,近期Seaweed和Pixeldance兩款視頻生成模型的Pro版也將開放使用。Pro 版模型能實現(xiàn)自然連貫的多拍動作與多主體復(fù)雜交互,攻克了多鏡頭切換的一致性難題,在鏡頭切換時可同時保持主體、風(fēng)格、氛圍的一致性,適配電影、電視、電腦、手機等各種設(shè)備的比例。

      字節(jié)抖音和快手,作為國內(nèi)短視頻平臺的領(lǐng)軍者,雙方的競爭已經(jīng)從短視頻、電商轉(zhuǎn)移至AI領(lǐng)域,客觀來說,抖音在各方面都壓快手一頭。但唯獨在AI領(lǐng)域,快手給出了漂亮的反擊。

      自6月一鳴驚人之后,快手可靈其實已經(jīng)有數(shù)次的小版本的迭代。

      但在底層大模型能力上,今年9月20日,快手發(fā)布可靈1.5版本,接入新一代模型,實現(xiàn)了畫質(zhì)和動態(tài)質(zhì)量都大幅提升,原有的模型也加入了新功能——運動筆刷,生成效果可控性增強。

      “可靈1.5很強,可以說是所有模型里面最真實的,吊打Runway,基本上已經(jīng)克服了之前人物變形的問題。”AIGC創(chuàng)業(yè)者洋芋醬AIgen(藝名)如此對光錐智能說道。

      在實際生成的視頻效果中,對比可靈和Runway,可以看到,同一個提示詞,兩者在實際人物主體的穩(wěn)定性上效果都很強,但可靈生成出的視頻效果能夠自動解鎖面部表情。

      “Runway其實也能自主生成面部表情,但效果非常詭異。”洋芋醬AIgen如此說道,不過,可靈AI和Runway這種能力是隨機的,并不固定。

      這其實也能夠看到,可靈AI和Runway在實際生成效果上更勝一籌,而在對提示詞的理解上,可靈AI也確實走在前列,但未來也仍需要不斷迭代升級,才能將這一能力固化下來。

      (Runway,提示詞一個穿著新中式服裝的女模特,正在展示自己的造型,背景是彩色的煙霧飄散,洋芋醬AIgen提供)

      (可靈AI,提示詞一個穿著新中式服裝的女模特,正在展示自己的造型,背景是彩色的煙霧飄散,洋芋醬AIgen提供)

      不過,此次即夢上線最新視頻生成大模型之后,尾鰭Vicky則認(rèn)為其在模型能力和UI設(shè)計上,與可靈同屬第一梯隊。同時,在使用即夢平臺Pro版模型的時候,其能夠輕松控制畫面的運動幅度和動作。

      作為國內(nèi)頭部的短視頻平臺,快手和字節(jié),在AI視頻生成賽道的布局,終局目的是要吸引和留住用戶的注意力,而這就需要不斷生產(chǎn)出新穎、有質(zhì)量、有創(chuàng)意的內(nèi)容。

      基于此,AI短劇,也成為字節(jié)即夢和快手可靈競爭的焦點之一。

      今年7月份,由“可靈AI”創(chuàng)作出的AI短劇《山海奇鏡之劈波斬浪》引發(fā)廣泛關(guān)注,該短劇成為國內(nèi)首部AIGC原創(chuàng)奇幻微短劇。

      9月,快手星芒短劇聯(lián)合“可靈AI”推出了“星有靈犀-AI短劇創(chuàng)作大賽”。據(jù)悉,大賽以流量獎勵、榮譽獎勵、內(nèi)容簽約等多項舉措激勵更多人加入AI短劇創(chuàng)作。

      字節(jié)同樣不甘示弱,即夢AI在聯(lián)手博納影業(yè)發(fā)布首部AIGC生成科幻短劇《三星堆:未來啟示錄》的同時,也在聯(lián)手抖音平臺多位“超級創(chuàng)作者”實現(xiàn)共創(chuàng),邀請平臺上有高質(zhì)量粉絲及高影響力的達人,共同加入“超級創(chuàng)作者聯(lián)盟”計劃,希望借此打造國內(nèi)最大的虛擬創(chuàng)作社群。

      但現(xiàn)階段不管是抖音,還是快手,其視頻平臺的影視創(chuàng)作者創(chuàng)作的內(nèi)容,“很難破圈兒。”尾鰭Vicky如此說道,“因為現(xiàn)在整個市場尚未形成,C端用戶并不知道用它來干嘛。頭部會有一些商業(yè)化需求,但需求并不多,整體并不穩(wěn)定。”

      畢竟,現(xiàn)階段全球的專業(yè)創(chuàng)作者還比較少,且AI視頻生成大模型技術(shù)尚處于早期階段。

      因此,作為頭部視頻平臺,字節(jié)和快手之間的競爭也日趨激烈,而除了底層AI技術(shù)、產(chǎn)品之爭外,更重要的則在于誰能夠率先探索出技術(shù)賦能內(nèi)容之路。畢竟,平臺如果能夠聚集更多具有創(chuàng)新意識的內(nèi)容創(chuàng)作者,就能夠打造出一個更受用戶關(guān)注和喜愛的社區(qū)生態(tài)。

      當(dāng)然,除了字節(jié)和快手之外,在AI視頻生成賽道中的其他玩家,也開始出現(xiàn)“分野”,部分中小廠商,也開始探索并走出了一條屬于自己的差異化競爭之路。

      細(xì)分市場崛起,

      找準(zhǔn)自身定位是王道

      在抖音、快手等短視頻平臺上,一些創(chuàng)作者創(chuàng)作的內(nèi)容可能破圈兒難度比較大,但一些包含鬼畜特效的視頻,卻異常的火爆,比如由AI生成的何炅和黃磊突然打架的視頻。

      對于AI視頻生成賽道的玩家來說,如果字節(jié)和快手,是全方位的技術(shù)和內(nèi)容生態(tài)體系的競爭,而其他中小玩家更多的則是聚焦在細(xì)分賽道,找準(zhǔn)自身平臺和產(chǎn)品定位,則成為生存發(fā)展的基礎(chǔ)。

      10月底,Runway的CEO在公開信中明確表示, Runway并不是一家AI公司,而是一家媒體和娛樂公司,“我認(rèn)為 AI 公司的時代已經(jīng)結(jié)束了。”

      基于此,在各大公司爭相卷AI視頻生成長度、逼真度、流暢度的時候,Runway顯然已經(jīng)在AI視頻賽道中走出了自己的特色——做專門服務(wù)于藝術(shù)、媒體和娛樂的AI。

      從Runway的實際視頻生成效果來看,其在人物穩(wěn)定性、一致性上的效果可以說走在前列。而除了基礎(chǔ)技術(shù)能力外,在最新的版本更新中,Runway上線的2個新功能雖小,但都將為動畫師、游戲開發(fā)者和電影制作人提供非常大的便利、節(jié)約巨大的成本。

      Runway可以說是最受影視從業(yè)者歡迎的產(chǎn)品之一,除技術(shù)實力之外,更重要的還在于性價比。

      “ Runway實在是太香了,我們用可靈都是省著用,但是Runway是無限次數(shù)的,每天抽個幾百次都無所謂。”洋芋醬AIgen表示,“AI視頻的隨機性還是很強的,如果按次收費,普通創(chuàng)作者可能很難承受起這個成本。”

      反觀可靈,如果用1000元購買積分,能夠購買15000可靈值,每次用35可靈值,1000元只能生成428次。對于真正的創(chuàng)業(yè)者來說,基本不夠用,“按照我在Runway每天要生成兩百多次視頻的頻率來看,可靈1000元購買的積分基本2天就燒完了。”洋芋醬AIgen如此說道。

      在光錐智能上一篇《爆“卷”的AI視頻,大廠向左,創(chuàng)企向右》文章中也提到過,對于現(xiàn)階段各平臺采用的會員制收費方式,對于不能夠商業(yè)化閉環(huán)的創(chuàng)業(yè)者而言,后續(xù)的付費率和付費意愿都不會很高。而現(xiàn)如今看來,對于即使能夠?qū)崿F(xiàn)商業(yè)化閉環(huán)的創(chuàng)業(yè)者而言,性價比也是影響其使用產(chǎn)品的關(guān)鍵因素。

      而除了Runway之外,Pika和Pixverse也找到了自己的賽道。從他們最新更新的版本中可以看到,這兩家重點是訓(xùn)練了一些用戶能夠直接使用的特效效果,“雖然比喻可能會不太恰當(dāng),但是有點接近之前抖音做的那種貼紙。”洋芋醬AIgen說道。

      比如在10月底萬圣節(jié)期間,PixVerse V3版本新增了不少萬圣節(jié)主題的特效,包括僵尸模式、巫師帽和怪物入侵等主題效果,還有類似于Pika很火的AI捏捏特效,視頻延長功能,用戶可以為已有視頻額外增加5-8秒的內(nèi)容,并能精確控制新增片段的內(nèi)容走向。

      而隨著最近《毒液:最后一舞》電影的上映,PixVerse基于最新視頻模型PixVerse V3推出了新特效“我們是毒液”的視頻效果,能夠一鍵將圖片生成酷炫毒液動畫。

      當(dāng)前,在社交平臺上,這種鬼畜特效非常受用戶歡迎。此前Pika在1.5版本中,就推出了AI捏捏的特效,一經(jīng)推出,就備受用戶喜愛,其也靠著這一波特效,實現(xiàn)了彎道超車。而和Pika差不多時間開始增長的海螺AI,其實也是靠人物表演和meme表情包直接拉爆了海外輿論,彎道超車。

      事實上,盡管海螺AI推出時間較晚,但行業(yè)從業(yè)者對海螺AI的評價并不低。“海螺AI在人物動作上的表現(xiàn)很厲害,最近何炅和黃磊打架的AI生成視頻,就是通過海螺AI生成。”洋芋醬AIgen說道。

      不過,海螺AI更重要的是實現(xiàn)了“國內(nèi)開花,墻外香”的效果。作為國內(nèi)AI公司MiniMax在海外推出的AI視頻生成平臺,其一經(jīng)推出,搜索熱度持續(xù)攀升。

      據(jù)“AI產(chǎn)品榜”統(tǒng)計,海螺AI網(wǎng)頁版9月訪問量大漲860%,登頂9月全球及國內(nèi)增速榜首。海外用戶紛紛在社交平臺分享使用體驗,普遍認(rèn)為海螺AI是目前市面上最出色的AI視頻生成工具之一。

      而憑借產(chǎn)品在海外市場的爆火,MiniMax在商業(yè)化能力上,已經(jīng)走在大模型六小虎的前列。

      相比較來說,像Vidu和智譜清影這一類的平臺,在主體一致性和人物穩(wěn)定性中,視頻生成時長等方向上正在不斷進化,但尚未形成專屬于自己風(fēng)格的賽道和獨特的競爭優(yōu)勢。

      盡管AI視頻生成技術(shù)正不斷進化,并衍生出具有特色的細(xì)分賽道。但信達證券研報也顯示,AI視頻生成技術(shù)在人物一致性、所需時長、畫面質(zhì)量等方面仍需進一步提升,以滿足商業(yè)化水準(zhǔn)。

      同時,目前主流AI視頻工具還處在視頻生成競爭的階段,且大多數(shù)為單一功能產(chǎn)品,仍需要多種不同的視頻創(chuàng)作工具串聯(lián)使用才能達到直接輸出可商業(yè)化視頻的效果。

      未來,AI視頻生成大模型平臺,仍需要不斷迭代進化。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。