2024年上半年的AI視頻生成賽道,快手毫無疑問是最大的贏家。視頻生成大模型可靈在六月推出之后,憑借更高的可用性和更快的功能迭代,風(fēng)頭很快超過了將這個賽道推到舞臺中心的Sora,也讓快手在這一輪的大模型競爭中找到了屬于自己的位置。
可靈在市場上受到的追捧,也成功點燃了更多人對AI視頻生成的熱情。C端,快手和抖音上有越來越多的創(chuàng)作者開始采用AI視頻生成技術(shù)進行創(chuàng)作,AI視頻生成與短劇的結(jié)合更是被寄予厚望。B端,可靈在7月迎來了更多具備可用性的同仁,有智譜AI的清影、生數(shù)科技正式上線的Vidu、愛詩科技的PixVerse V2。
但是,AI視頻生成賽道的火熱到目前為止還沒有呈現(xiàn)「百模大戰(zhàn)」那樣的盛況。一個很明顯的差異是,此前圍繞AI Agent和AI搜索熱情嘗試的互聯(lián)網(wǎng)大廠,在AI視頻生成領(lǐng)域卻沒有像快手一樣傾注企業(yè)的全力,甚至有一部分參與「百模大戰(zhàn)」的企業(yè)并沒有發(fā)布相應(yīng)的產(chǎn)品。
在可靈走紅之后,也只看到了阿里團隊推出了面向軌跡的DiT框架Tora,字節(jié)在App Store上線了即夢的移動版。前者能夠看到的還僅是官網(wǎng)上公布的演示視頻和論文內(nèi)容?梢栽囉玫膁emo還沒有上線;后者并沒有對比可靈更早上線的AI視頻生成能力進行更新,更像是一項常規(guī)動作。
很明顯,AI視頻生成在不同企業(yè)內(nèi)部有著不同的優(yōu)先級,決定先后順序的是企業(yè)有什么和想要成為什么。擁有云服務(wù)基礎(chǔ)且業(yè)務(wù)布局更廣泛的字節(jié)、阿里、騰訊會更側(cè)重布局未來,讓自己成為AI時代的基礎(chǔ)設(shè)施提供者和獲取AI服務(wù)的最大入口;專注大模型研發(fā)的創(chuàng)業(yè)企業(yè)最需要將AI技術(shù)能力轉(zhuǎn)化為實際的業(yè)務(wù)和收入。
對于快手這種已經(jīng)在移動互聯(lián)網(wǎng)時代圈占下一片領(lǐng)地,擁有一定規(guī)模用戶體量的企業(yè),當(dāng)務(wù)之急是要將AI技術(shù)融入到改在現(xiàn)有業(yè)務(wù)的進程中,為自己的領(lǐng)地建立一堵可防御AI技術(shù)沖擊的堅固城墻,讓自己在AI時代也能延續(xù)自己的領(lǐng)地。然后,可能才會考慮到向領(lǐng)域外拓展自己的AI能力。
快手在可靈的研發(fā)上拿出「大力出奇跡」的作風(fēng),力求以更快地速度拿出更具可用性的產(chǎn)品,一定程度上顯示出了追逐AI浪潮的急迫。在可靈上線之后,快手也通過上線AI短劇《山海奇鏡之劈波斬浪》、舉辦視頻創(chuàng)作大賽、推出創(chuàng)作者孵化計劃、給予流量扶持,積極地擴大AI視頻生成內(nèi)容的影響力和應(yīng)用范圍。
在快手的一系列動作中,我們看到了可靈們影響和改變短視頻內(nèi)容生態(tài)的決心。這是一種實用主義的聚焦型/收斂型策略。同時,在OpenAI對Sora的定義中,Sora是構(gòu)建物理世界通用模擬器的一條可行之路實現(xiàn)AGI的又一個里程碑。這看上去又賦予AI視頻生成一個發(fā)散拓展的可能性。
無論從現(xiàn)階段的實際技術(shù)能力上,還是企業(yè)的具體業(yè)務(wù)布局上,「世界模型」都還只是遙遠(yuǎn)而美妙的幻境?伸`們極難借此幫助快手們完成AI時代的站位躍遷,改變視頻創(chuàng)作可能是目前更有可能觸摸到的未來。
可靈必須大力出奇跡
與快手此前給人留下的慢企業(yè)印象不同,被逐漸還原的可靈開發(fā)過程更像是一個字節(jié)式的「大力出奇跡」故事:受到Sora鼓舞,一個二十余人的小團隊開始進行AI視頻生成技術(shù)的研發(fā),很快被確定為快手的戰(zhàn)略級項目,得到了企業(yè)資源的全力傾斜,不計投入,以最快速度實現(xiàn)可用,然后持續(xù)優(yōu)化迭代。
這個過程中,快手表現(xiàn)出了堅定的戰(zhàn)略決心和執(zhí)行力。快手CEO程一笑對可靈項目的表態(tài)是「一定要大做」?焓指呒壐笨偛、主站業(yè)務(wù)與社區(qū)科學(xué)線負(fù)責(zé)人蓋坤則承諾,企業(yè)的卡都給可靈項目用,企業(yè)全力支持。協(xié)作部門也紛紛給予可靈項目最積極地配合。
從3月到6月,可靈項目用了三個月時間就被推向了市場,發(fā)布一個月后就已經(jīng)開放給超30萬用戶使用,生成超700萬條短視頻,獲得了很好的反饋。上線之后,可靈依然保持了極快的更新頻率,通過幾次升級陸續(xù)增加了圖生視頻、視頻續(xù)寫功能,以及PC端的網(wǎng)站。
快手在可靈項目上的這種少有的急迫感,可能源于緊跟AI的戰(zhàn)略判斷與沒站在大模型舞臺聚光燈下的矛盾。在大模型引爆新一輪AI熱炒的一年多時間里,快手雖然也跟隨潮流推出了大語言模型「快意」和文生圖大模型「可圖」,卻沒能借此在激烈的大模型競爭中實現(xiàn)領(lǐng)跑。
其背后的原因是,快手對短視頻業(yè)務(wù)的專注,使其并不擅長為AI Agent和AI搜索等大語言模型應(yīng)用,提供足夠豐富的面向未來應(yīng)用場景的接口。缺乏應(yīng)用前景的探索自然也無法快速建立從技術(shù)到應(yīng)用的產(chǎn)品延伸鏈條。當(dāng)然,快手并沒有放棄,依然在嘗試推出「飛船」這樣的智能助手APP。
Sora的出現(xiàn)為快手帶來了一個最有能力抓在手中的時代機遇。作為頭部短視頻平臺,快手在算法技術(shù)的人才積累之外,還有大量標(biāo)注清晰地干凈視頻數(shù)據(jù),疊加上企業(yè)全力傾斜資源的BUFF,能夠打出一個時間差,通過快速上線高可用性的產(chǎn)品,讓雪球滾起來,在AI視頻生成領(lǐng)域建立優(yōu)勢。
可靈在現(xiàn)一階段的表現(xiàn)已經(jīng)驗證了快手這次戰(zhàn)略卡位的有效性。不同的測評結(jié)果驗證了可靈在同類產(chǎn)品中能夠?qū)崿F(xiàn)比較好的視頻生成效果,特別是在生成視頻的局部細(xì)節(jié)和畫面質(zhì)感上的優(yōu)勢。相較而言,一部分測評都認(rèn)為缺少足夠的高質(zhì)量視頻訓(xùn)練數(shù)據(jù),導(dǎo)致智譜AI的清影生成了太多動畫內(nèi)容與模糊畫質(zhì)的視頻,影響了使用體驗。
內(nèi)斂型的AI策略選擇
通過可靈快速上線搶占先機之后,快手將先機轉(zhuǎn)換為長久的賽道競爭優(yōu)勢,需要技術(shù)快速融入與改變視頻場景。這也符合快手在2023年初確定的新AI戰(zhàn)略的指向,即讓AI技術(shù)賦能現(xiàn)有的業(yè)務(wù)場景,探索AI如何圍繞短視頻落地應(yīng)用。這也意味著,快手會更傾向于利用AI技術(shù)強化現(xiàn)有的護城河,而不是越過河去擴張新的領(lǐng)地。
在2024世界人工智能大會舉辦期間,蓋坤和快手副總裁、大模型團隊負(fù)責(zé)人張迪的演講,也體現(xiàn)了快手讓AI服務(wù)于短視頻的聚焦型戰(zhàn)略選擇。蓋坤表示,快手的大模型矩陣深度服務(wù)快手的商業(yè)生態(tài)場景。張迪則認(rèn)為,將用大模型技術(shù)重塑快手業(yè)務(wù),能夠提升創(chuàng)作者的內(nèi)容生產(chǎn)體驗和用戶的內(nèi)容消費體驗。
在可靈上線PC端應(yīng)用的同時,主打AI圖像生成的可圖平臺也被融入進了可靈中。整合后,快手的可靈與字節(jié)的即夢一樣,不再局限于AI視頻生成,而成為了一個瞄準(zhǔn)AI創(chuàng)意內(nèi)容生成的綜合平臺。這是快手快影和字節(jié)剪映之間圍繞視頻創(chuàng)作工具的競爭在AI時代的延續(xù)。
在融合AI視頻生成內(nèi)容的動作上,快手要顯得更為激進。首先,快手舉辦了「靈」感迸發(fā)——首屆「可靈」AIx快影視頻創(chuàng)作大賽,總獎金額度達(dá)到30萬元;其次,快手公布了「可靈AIx星芒短劇」創(chuàng)作者孵化計劃,為AI短劇創(chuàng)作者提供千萬級流量扶持,且不限參與賬號的粉絲數(shù)量。
可靈融入快手短視頻生態(tài)可以幫助快手實現(xiàn)兩個目標(biāo):一個是從內(nèi)容側(cè)考量,補充快手原創(chuàng)內(nèi)容生態(tài)的同時,探索AIGC時代下的短視頻產(chǎn)品形態(tài);另一個是從商業(yè)化上考慮,利用大模型矩陣的能力降低品牌生成高品質(zhì)短視頻和直播內(nèi)容的成本,提升線索轉(zhuǎn)化率。
快手的AI戰(zhàn)略代表了一類企業(yè)面對AI時代的心態(tài)。這類企業(yè)的特點是在PC互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)時代在某一個垂直賽道站穩(wěn)了腳跟,擁有一定規(guī)模的用戶,較難參與到底層基礎(chǔ)設(shè)施的競爭中,增速放緩但業(yè)務(wù)相對穩(wěn)定?焓种,Soul、360、小紅書等都屬于這類企業(yè)。
Soul在內(nèi)部達(dá)成了一個共識——單純的技術(shù)并不能夠去構(gòu)建壁壘,其實說端內(nèi)發(fā)展給用戶帶來價值,這才是各行各業(yè)的護城河。因此,Soul更多是針對滿足用戶的社交訴求,利用AI的手段來解決問題,而沒有去追求AGI。在Soul APP CTO陶明看來,這種AI強化業(yè)務(wù)的邏輯,會給企業(yè)建立一條更具差異化的發(fā)展路徑。
快手高級副總裁、主站業(yè)務(wù)與社區(qū)科學(xué)線負(fù)責(zé)人蓋坤
這種邏輯本質(zhì)上就是將AI作為放大器,達(dá)到持續(xù)放大業(yè)務(wù)已有勢能的目的。提出要走CoE(協(xié)同)專家模型的360也是如此。這是一種大模型時代的入口邏輯,充分利用360原有產(chǎn)品的流量積累,將360和第三方的AI能力整合到一起,通過360的意圖識別模型和任務(wù)分解調(diào)度模型進行需求與模型能力的匹配。
因其擁有一定的業(yè)務(wù)積累和用戶基礎(chǔ),所以在制定自己的AI戰(zhàn)略時不能像智譜AI、月之暗面那樣丟下包袱輕裝上陣,講一個直指AGI的、重投資高風(fēng)險的宏大故事。又因為他們的業(yè)務(wù)相對垂直,沒有面向其他場景的豐富觸點,也很難像騰訊、阿里、字節(jié)、百度那樣在AI時代繼續(xù)橫向拓展,爭取成為基礎(chǔ)設(shè)施提供者的機會。
可靈們的機會在哪里
就可靈而言,它能夠帶給快手三個不同層級的可能性:
第一個是可靈真的成為OpenAI預(yù)想中的「世界模擬器」,快手借此獲得一個沖出短視頻行業(yè)的機會;第二是可靈成為新一代的內(nèi)容創(chuàng)作工具,大大降低短劇等專業(yè)影視內(nèi)容的創(chuàng)作門檻,讓快手沿著視頻產(chǎn)業(yè)鏈條向上繼續(xù)延伸;第三是可靈降低用戶創(chuàng)作短視頻的門檻,極大豐富快手的短視頻供給。
從遲遲未能上線應(yīng)用的Sora,以及目前已經(jīng)上線的可靈、清影、Gen-3、luma等視頻生成大模型的使用體驗來看,AI視頻生成技術(shù)還處在非常初級的發(fā)展階段。世界模型有可能像大語言模型一樣,在經(jīng)歷過算法框架創(chuàng)新帶來的初期發(fā)展紅利之后,受限于訓(xùn)練數(shù)據(jù)、訓(xùn)練算力等條件的制約,在較長時間內(nèi)停滯不前。
對于快手來說,AI+短劇可能是比世界模擬器更有幾率實現(xiàn)的目標(biāo)。在可靈開始研發(fā)的3月,快手就公布了短劇+的短劇戰(zhàn)略布局,短劇+AIGC是這個布局中的一個環(huán)節(jié)。AI短劇《山海奇鏡之劈波斬浪》的制作計劃也是在同一階段宣布,并原定于4月底上線。
最終隨著可靈的快速上線,利用可靈重新打磨的《山海奇鏡之劈波斬浪》于7月發(fā)布,并在上線十天后收獲了超過5000萬觀看量。此外,抖音推出了與博納合作的AI短劇《三星堆:未來啟示錄》,央視頻發(fā)布了《英雄》《愛永無終止》《奇幻專賣店》三部短劇。
在可靈們的加持下,隨著這些打樣作品的上線,理論上能降低創(chuàng)作門檻的AI與賺錢的短劇相融合,快速勾勒出了一個低成本、高回報的AI短劇遠(yuǎn)景。博納影業(yè)集團影視制作副總經(jīng)理曲吉小江還提出了「從短劇走向長劇再走向游戲」的AI短劇三步走計劃。市場也對于短劇的重要生態(tài)平臺快手給予了厚望。
但是,從創(chuàng)作者的分享來看,可靈們可能降低了制作一部短劇的整體成本,但并沒有將制作門檻降低太多。大模型雖然能根據(jù)提示詞生成視頻內(nèi)容,并且在生成的視頻時長和效果上也比半年前都有很大的提升。但是,大模型對提示詞的理解、對畫面的生成還存在很大的迭代空間。
一個很直接的例子是,在《山海奇鏡之劈波斬浪》導(dǎo)演陳坤的介紹中,團隊針對一個火神和水神打架鏡頭抽卡100次,也沒能抽到特別滿意的過程,「實際用的畫面其實也是帶了一定畸變的」。AI短劇的創(chuàng)作者需要的不僅是講故事的能力,還要強化與AI溝通的能力。這并不是一個一蹴而就的過程。
目前來看,AI視頻生成融合短視頻生態(tài)最有可能在短時間內(nèi)大規(guī)模鋪開的,是第三種可能,讓現(xiàn)在正在創(chuàng)作短視頻的用戶能更好地豐富自己的視頻內(nèi)容。一種已經(jīng)能看到的趨勢是,在快手和抖音上的一些口播創(chuàng)作者開始利用AI生成的視頻匹配自己的口播內(nèi)容,為觀看者提供更生動的內(nèi)容體驗。
從原有內(nèi)容的優(yōu)化到AI原生短劇的規(guī)模化,再到內(nèi)容創(chuàng)作者與內(nèi)容消費者之間的界限模糊更有可能是快手在AI時代的三步走計劃。對于同樣在AI時代秉持聚焦型戰(zhàn)略的企業(yè)而言,這三步走計劃可以概括為優(yōu)化已有功能、探索AI原生功能、實現(xiàn)用戶的AI化。這是可靈們更能抓住的機會。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。