宏景智駕完成數(shù)億元C輪融資植物生長(zhǎng)好幫手:廣明源金線蓮組培燈照亮生長(zhǎng)每一步ROG純白系列DIY好物:簡(jiǎn)約不失高雅,買它準(zhǔn)沒錯(cuò)!穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過DCI認(rèn)證并投入市場(chǎng)安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎(jiǎng)電動(dòng)自行車強(qiáng)制性“國(guó)標(biāo)”再修訂,綠源電動(dòng)車以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對(duì)承壓的小家電市場(chǎng),小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營(yíng)收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來激光電視主機(jī)僅有iPad大小2024年冷年空調(diào)市場(chǎng)總結(jié):規(guī)模下探,結(jié)構(gòu)降級(jí),空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學(xué)能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀(jì)念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動(dòng)能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機(jī)型蓄勢(shì)待發(fā)云天勵(lì)飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    快手可靈,能成為中國(guó)Sora嗎?

    2024年07月05日 09:27:02   來源:科技新知公眾號(hào)

      快手祭出文生視頻模型的的王炸,產(chǎn)品型創(chuàng)新能讓快手領(lǐng)先多少?

      “甚至我覺得也吊打了Sora,我認(rèn)為這個(gè)產(chǎn)品今天,在我能使用的范疇內(nèi)就是全世界第一的。”鏡頭前,獵豹移動(dòng)董事長(zhǎng)傅盛,難掩興奮的表情。而他口中,能吊打國(guó)內(nèi)外各個(gè)文生視頻模型的產(chǎn)品,就是快手可靈視頻生成大模型。

      6月6日,快手發(fā)布AI視頻模型,而就在發(fā)布當(dāng)天,就有諸多如傅盛一樣的業(yè)內(nèi)人士,獲得邀請(qǐng)碼進(jìn)行了第一波測(cè)試。從業(yè)內(nèi)的反饋以及可靈生成的視頻樣本來看,快手可靈似乎與Sora已然非常相近,在第一版五秒中的視頻中,業(yè)內(nèi)反饋無論技術(shù)路線,和訓(xùn)練數(shù)據(jù)質(zhì)量都較為突出。而更為令業(yè)內(nèi)興奮的是,快手可靈似乎做到了如Sora一般極度真實(shí)的還原物理規(guī)律,無論是運(yùn)動(dòng)的合理性,還是其他物理特性,甚至概念組合能力和想象力都表現(xiàn)得較為優(yōu)秀。

      但也有業(yè)內(nèi)人士指出,Sora是今年2月公布的,其訓(xùn)練有可能在去年年底就完成了,可靈多出幾個(gè)月的訓(xùn)練時(shí)間。更進(jìn)一步來說,能調(diào)用更多的訓(xùn)練算力,是可靈的優(yōu)勢(shì)。

      隨后6月21日,可靈模型再次拋出新的功能,圖生視頻以及視頻續(xù)寫等功能上線,讓產(chǎn)品功能更加豐富。

      可靈的表現(xiàn)之所以從某種程度超出業(yè)內(nèi)的預(yù)期,最為關(guān)鍵的是,在其公布之前,絕大部分AIGC從業(yè)者對(duì)其一無所知,快手的通用語(yǔ)言大模型快意,在國(guó)內(nèi)大模型梯隊(duì)中,作為新品上線暫無耀眼表現(xiàn),知名度也沒有投入了大量營(yíng)銷預(yù)算和研發(fā)成本的豆包、混元、文新一言、月之暗面等一眾新老勢(shì)力名氣大。

      就在這種情況之下,可靈的出現(xiàn)似乎打破了行業(yè)內(nèi)的認(rèn)知,從技術(shù)性到產(chǎn)品性的轉(zhuǎn)化,也有了新的路徑。但需要清醒的是,驚艷的產(chǎn)品距離能夠廣泛應(yīng)用,以及成功的商業(yè)化,都有較大的距離,而快手能否依靠可靈完成超車,與同行拉開差距,此刻來看,還面臨著不少的風(fēng)險(xiǎn)與挑戰(zhàn)。

      Part.1

      劍走偏鋒的快手

      “可以說的是,可靈這個(gè)事情肯定是一個(gè)非常復(fù)雜的,重資源投入,多兵種協(xié)作的復(fù)雜項(xiàng)目,肯定不是一個(gè)單一的天才的想法隨便搞出來的東西。”快手視覺生成與互動(dòng)中心負(fù)責(zé)人萬鵬飛在2024北京智源大會(huì)先后拒絕了幾個(gè)關(guān)于可靈參數(shù)、性能的問題之后,給出了一個(gè)較為實(shí)際的回答。

      在國(guó)內(nèi)的AI賽道,能吸引C端目光的部分,其實(shí)相當(dāng)有限,其中的焦點(diǎn)是,百模大戰(zhàn)留下的各類語(yǔ)言大模型,月之暗面是個(gè)典型的代表,從默默無聞到估值達(dá)30億美金,公司只用了不到1年時(shí)間,但從產(chǎn)品上來看,除了一款有長(zhǎng)文本閱讀能力的Kimi之外,C端對(duì)其感知并不明顯。

      而另一方面,資本和創(chuàng)業(yè)方似乎都非常糾結(jié),以金沙江創(chuàng)投管理合伙人朱嘯虎為代表的現(xiàn)實(shí)主義派,始終在保持一種相對(duì)悲觀的態(tài)度。比如朱嘯虎認(rèn)為這一代大模型創(chuàng)業(yè)公司,面臨比上一代商湯等AI公司更惡劣的處境:公司之間技術(shù)沒有差異,每一代技術(shù)都要重新砸錢,且投資規(guī)模指數(shù)級(jí)上升。根據(jù)媒體報(bào)道,在OpenAI發(fā)發(fā)布GPT-4o后,朱嘯虎在朋友圈的新判斷是,“不是深度綁定大廠的模型公司基本已經(jīng)出局”。

      而正是在這種復(fù)雜的環(huán)境之下,產(chǎn)品的創(chuàng)業(yè)面臨的困難就愈發(fā)之多。在商業(yè)化的要求之下,各大模型廠商先后加入了價(jià)格戰(zhàn),而即便估值已達(dá)30億美元,Kimi也在從打賞等方式試圖完成變現(xiàn)。

      資本的小心翼翼,疊加大廠的FOMO“不愿錯(cuò)過”成了當(dāng)下AI,創(chuàng)業(yè)的主基調(diào),從這個(gè)視角來看,可靈的成功更加難能可貴。

      在文生圖賽道之中,有業(yè)內(nèi)人士評(píng)論道,快手能拿出國(guó)內(nèi)第一個(gè)令人驚艷的“準(zhǔn)Sora”文生視頻大模型,與平臺(tái)深耕視頻內(nèi)容相關(guān)。但是抖音的視頻數(shù)據(jù)更多、算力更強(qiáng)、在AI方面投入更大,為什么反而沒拿出來類似量級(jí)的大模型?

      而從摩根史丹利的研報(bào)中也可以看出,目前,可靈的表現(xiàn)要比抖音和騰訊過往發(fā)布的視頻生成模型都更加優(yōu)秀,從時(shí)長(zhǎng)來看,可靈可以生成長(zhǎng)達(dá)2分鐘的視頻,而抖音的即夢(mèng)目前只支持生成最長(zhǎng)3秒的視頻、騰訊的混元大模型則能生成16秒。

      歸根到底,大模型本質(zhì)上還是基礎(chǔ)研發(fā)的交戰(zhàn),必須從基礎(chǔ)研發(fā)層面下功夫。而字節(jié)跳動(dòng)的策略是以應(yīng)用端促進(jìn)研發(fā),整個(gè)字節(jié)跳動(dòng)AIGC線條的人員非常混亂,真正的技術(shù)牛人不多,C端應(yīng)用思維主導(dǎo)了整個(gè)AI平臺(tái)的研發(fā),這可能不是正確方向。

      而從實(shí)踐上來看,與其說可靈的產(chǎn)品是技術(shù)的領(lǐng)先,不如說快手,在這一賽道策略布局的成功。用獵豹傅盛的話來說,“可靈的成功,更加證明了,Sora并不是一項(xiàng)技術(shù)性突破,而是產(chǎn)品型圖片”

      可靈的劍走偏鋒,無疑給行業(yè)帶來了全新的啟示,但能否就此判斷可靈在文生視頻賽道與國(guó)內(nèi)AI大廠差距已經(jīng)拉開似乎還需要更多實(shí)踐證據(jù)。

      Part.2

      能否成為下一個(gè)爆款?

      盡管可靈已然做出了不少成績(jī),但想要成為AI賽道的下一個(gè)Killing APP,可靈要走的路也許還有很多。

      首先,可靈想要大規(guī)模應(yīng)用,尚需要時(shí)間。在最新的交互頁(yè)面之中,申請(qǐng)可靈的人數(shù)已達(dá)41萬+,據(jù)接近快手人士透露,可靈雖然已有超過10萬+的使用者,但目前試用范圍依舊無法完全匹配市場(chǎng)需求,即便是快手內(nèi)部的人想試用都很困難。而另一方面,當(dāng)下使用的結(jié)論,是基于內(nèi)測(cè)視頻得出,這也就意味著對(duì)于可靈的模型能力可能是高估的。

      而與此同時(shí),可靈對(duì)于行業(yè)內(nèi)也是神秘的存在,正如快手視覺生成與互動(dòng)中心負(fù)責(zé)人萬鵬飛對(duì)于各項(xiàng)參數(shù)的諱莫如深,外界對(duì)于可靈使用了多少算力、算力來自哪里,有沒有充足的推理算力可供大規(guī)模公測(cè),也同樣好奇。

      在可靈一方,不知是否為了繼續(xù)產(chǎn)品熱度,先后推出了圖片生成視頻,以及視頻續(xù)寫等功能,但測(cè)試下來,整體效果較為平淡,生成時(shí)間的不穩(wěn)定,以及差異化并不明顯的效果,也意味著這些功能尚需要進(jìn)一步優(yōu)化。

      而在行業(yè)最為關(guān)心的算力上,有從業(yè)者評(píng)估,快手同時(shí)從騰訊云和阿里云租用了大批“大卡”,而快手自身也有一批約為數(shù)千張的大卡,而根據(jù)多方消息猜測(cè),可靈的訓(xùn)練算力來源應(yīng)該是多元化的。

      而在另一方面,根據(jù)多方信源估計(jì),文生視頻大模型生成一分鐘1080P視頻至少要消耗100萬Token,推理算力需求遠(yuǎn)大于文生文,而在推理算力方面,L40采購(gòu)難度較大,快手可能面臨瓶頸,這也就意味著,快手可靈全面投入公測(cè)可能還是很遙遠(yuǎn)的事情。

      在多個(gè)短視頻平臺(tái),甚至諸多海外社交媒體,可靈幾乎已經(jīng)成了中國(guó)Sora的代名詞,海外博主一碼難求,國(guó)內(nèi)測(cè)評(píng)博主聲稱,已達(dá)到了,免費(fèi)、可用、可實(shí)操的階段,但這樣的結(jié)論,從目前來看,似乎還有不小的差距。

      從某種程度來說,可靈是一款戰(zhàn)略意義遠(yuǎn)大于實(shí)際意義的產(chǎn)品,技術(shù)的領(lǐng)先無可厚非,對(duì)于行業(yè)來說也有示范作用。但在真正意義上的廣泛應(yīng)用,似乎還需要很長(zhǎng)的時(shí)間。

      Part.3

      老鐵們的“新希望”?

      在可靈對(duì)外的宣傳之中,可靈的優(yōu)勢(shì)簡(jiǎn)單明晰,首先是真正可應(yīng)用,其次是視頻生成效果好。不僅可以能夠生成大幅度的合理運(yùn)動(dòng),能夠模擬物理世界特性,而且,生成的視頻分辨率高達(dá)1080p,最長(zhǎng)可達(dá)2分鐘(幀率30fps),允許用戶自由調(diào)節(jié)視頻的縱橫比。

      正是基于此,外界對(duì)于可靈商業(yè)化想象空間進(jìn)一步打開,有業(yè)內(nèi)人士總結(jié),在媒體與廣告行業(yè),可靈可以用于快速生成廣告宣傳片、新聞報(bào)道等,不僅能大幅提升生產(chǎn)效率,還可以通過數(shù)據(jù)分析優(yōu)化內(nèi)容。同時(shí),在教育與培訓(xùn)行業(yè),可靈可以輔助教師制作教學(xué)視頻,甚至生成虛擬的教學(xué)場(chǎng)景,為學(xué)生提供沉浸式的學(xué)習(xí)體驗(yàn)。另一方面,娛樂與社交媒體行業(yè),對(duì)于社交平臺(tái)和內(nèi)容創(chuàng)作者而言,可靈提供的個(gè)性化視頻生成工具將極大地豐富平臺(tái)內(nèi)容。

      多家券商研究機(jī)構(gòu),也對(duì)可靈表示樂觀,國(guó)泰君安互聯(lián)網(wǎng)傳媒研究表示,可靈大模型配套建設(shè)了高效的大規(guī)模自動(dòng)化數(shù)據(jù)解決方案,覆蓋了海量視頻挖掘、多維打標(biāo)篩選、視頻描述增強(qiáng)及數(shù)據(jù)驅(qū)動(dòng)的效果質(zhì)量評(píng)估等多個(gè)方面,在國(guó)產(chǎn)視頻生成大模型中居于前列。

      但豐滿的預(yù)期,在現(xiàn)實(shí)面前,似乎還有不小的差距。

      根據(jù)接近快手人士透露,當(dāng)下,可靈暫無商業(yè)化計(jì)劃,也不對(duì)外提供API。這就意味著,從投資層面來看,可靈對(duì)于快手近幾個(gè)季度的業(yè)績(jī)并無太大貢獻(xiàn)。而從快手近期在二級(jí)市場(chǎng)的表現(xiàn)來看,也可以印證,可靈似乎對(duì)于快手的幫助不大。

      在快手視覺生成與互動(dòng)中心負(fù)責(zé)人萬鵬飛演講中,在談到可靈的未來時(shí)曾提到,“視頻創(chuàng)作的門檻和效果的ROI大幅度提升,視頻創(chuàng)作者和消費(fèi)者界限逐漸模糊。越來越多消費(fèi)者變成創(chuàng)作者,對(duì)于視頻創(chuàng)作生態(tài)的繁榮是非常有價(jià)值的。

      從此可以簡(jiǎn)單猜測(cè),也許快手對(duì)于可靈的未來,更多的還是傾向于在自有生態(tài)中賦能更多的創(chuàng)作者,而從另一個(gè)視角來看,快手當(dāng)下面臨著不小的壓力,無論是廣告還是電商,增長(zhǎng)都在經(jīng)受住各個(gè)大廠的挑戰(zhàn)。而可靈的出現(xiàn),如果能如快手負(fù)責(zé)人所言,降低門檻,提升ROI,從而吸引更多的用戶從消費(fèi)者變成內(nèi)容生產(chǎn)者,無疑吸引力巨大。

      總結(jié)來看,可靈似乎讓國(guó)內(nèi)從業(yè)者以及更廣泛受眾看到快手在全新領(lǐng)域的努力和希望,但從全局來看,想要短期增加營(yíng)收,也許需要更長(zhǎng)的時(shí)間。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。