宏景智駕完成數(shù)億元C輪融資植物生長(zhǎng)好幫手:廣明源金線蓮組培燈照亮生長(zhǎng)每一步ROG純白系列DIY好物:簡(jiǎn)約不失高雅,買它準(zhǔn)沒錯(cuò)!穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過DCI認(rèn)證并投入市場(chǎng)安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎(jiǎng)電動(dòng)自行車強(qiáng)制性“國(guó)標(biāo)”再修訂,綠源電動(dòng)車以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對(duì)承壓的小家電市場(chǎng),小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營(yíng)收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來激光電視主機(jī)僅有iPad大小2024年冷年空調(diào)市場(chǎng)總結(jié):規(guī)模下探,結(jié)構(gòu)降級(jí),空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學(xué)能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀(jì)念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動(dòng)能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機(jī)型蓄勢(shì)待發(fā)云天勵(lì)飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充
  • 首頁 > 云計(jì)算頻道 > 大模型

    Sora再刷屏,但國(guó)內(nèi)玩家走的不是同一條路

    2024年03月27日 14:35:13   來源:數(shù)智前線

      相比于Sora的大力出奇跡,多數(shù)國(guó)內(nèi)的文生視頻玩家走的不是這一條路。

      Sora又有新動(dòng)向。3月25日,OpenAI首次公布了使用Sora制作的創(chuàng)意劇情短片。不同于此前的OpenAI主導(dǎo)生成,這次釋放出的視頻創(chuàng)作者是藝術(shù)家、設(shè)計(jì)師、創(chuàng)意工作者和電影人。

      在視頻創(chuàng)意闡釋環(huán)節(jié),不同的藝術(shù)創(chuàng)作者們講述了Sora在探索新的藝術(shù)領(lǐng)域和創(chuàng)意創(chuàng)作過程里的革新。某種程度而言,這也是OpenAI在打樣,向外界展示Sora在創(chuàng)意創(chuàng)作領(lǐng)域的想象空間。

      相較而言,過去一個(gè)多月來,國(guó)內(nèi)視頻AIGC領(lǐng)域因Sora而燃起的熱潮則涌向了不同的領(lǐng)域。資本市場(chǎng)、上市公司、互聯(lián)網(wǎng)平臺(tái)到創(chuàng)業(yè)團(tuán)隊(duì)都展示出了存在感,不過多數(shù)動(dòng)向都朝向了企業(yè)級(jí)市場(chǎng)和營(yíng)銷類場(chǎng)景。

      就像大模型在國(guó)內(nèi)市場(chǎng)更重視應(yīng)用場(chǎng)景探索和落地拷問,Sora引發(fā)的熱潮也表現(xiàn)出了同樣的趨勢(shì)。

      01

      國(guó)內(nèi)玩家進(jìn)場(chǎng)

      Sora在海外大火后,很快影響到了國(guó)內(nèi)資本市場(chǎng)。

      2月19日,Sora概念板塊開始出現(xiàn),當(dāng)時(shí)的指數(shù)是1124.75,但很快這一指數(shù)節(jié)節(jié)走高,到3月22日這個(gè)板塊雖有下跌,但仍到了1675.80的位置。

      板塊內(nèi)短劇游戲、手機(jī)游戲、多模態(tài)AI等多個(gè)板塊關(guān)聯(lián)公司都曾出現(xiàn)了股價(jià)的快速拉升。

      一些公司在投資者互動(dòng)平臺(tái)上回應(yīng)了在文生視頻賽道的投入和動(dòng)作,也引發(fā)了市場(chǎng)關(guān)注。比如因賽集團(tuán)3月中旬在投資者互動(dòng)平臺(tái)上表示,該公司正加大各項(xiàng)資源投入,推動(dòng)文生視頻相關(guān)營(yíng)銷應(yīng)用產(chǎn)品于3月底、4月初開放體驗(yàn)。

      去年12月該公司宣布推出營(yíng)銷行業(yè)的多模態(tài)垂直模型InsightGPT。據(jù)其提供信息,該模型的能力除了文生圖外,還具備文生文、視頻智能剪輯、圖生視頻等功能,并已在開發(fā)文生視頻功能。

      此外,上市公司萬興科技也宣布其推出的聚焦數(shù)字創(chuàng)意垂類創(chuàng)作場(chǎng)景的音視頻多媒體大模型具有文生視頻能力。易點(diǎn)天下則稱,旗下的AIGC數(shù)字營(yíng)銷創(chuàng)作平臺(tái)KreadoAI,基于文生視頻的數(shù)字人口播視頻制作功能,創(chuàng)意營(yíng)銷短視頻,已被廣泛應(yīng)用于廣告營(yíng)銷多種場(chǎng)景。

      大熱概念下,這些公司的股價(jià)飆升。以因賽集團(tuán)為例,它的股價(jià)2月8日最低點(diǎn)僅為21.12元,經(jīng)過一個(gè)多月狂飆,3月25日收盤價(jià)達(dá)到了64.52元。

      互聯(lián)網(wǎng)大廠也有動(dòng)作。不同于一些上市企業(yè)從數(shù)字營(yíng)銷領(lǐng)域來挖文生視頻技術(shù)的潛力,短視頻平臺(tái)的動(dòng)向更偏重于對(duì)自身平臺(tái)能力和生態(tài)角度出發(fā)動(dòng)作。

      2月初,字節(jié)旗下剪映海外版Capcut的AI生成視頻功能開放公測(cè)。另一平臺(tái)快手也于近日透露了在文生視頻技術(shù)的布局。

      快手首席執(zhí)行官程一笑在幾天前的業(yè)績(jī)電話會(huì)上稱,快手已于去年底推進(jìn)專項(xiàng)研發(fā),“我們認(rèn)為對(duì)短視頻生態(tài)是巨大的機(jī)會(huì),未來會(huì)把生成模型和生產(chǎn)者工具結(jié)合起來,幫助創(chuàng)作者降低創(chuàng)作門檻,提升短視頻制作質(zhì)量和效率。”

      平臺(tái)企業(yè)和上市公司之外,創(chuàng)業(yè)公司中則有玩家打出了國(guó)產(chǎn)版Sora概念產(chǎn)品。3月6日七火山發(fā)布了其結(jié)合Sora路線迭代的Etna文生視頻模型。據(jù)介紹,這個(gè)模型支持生成8~15秒時(shí)長(zhǎng)的視頻,視頻質(zhì)量每秒60幀。

      而3D數(shù)字人創(chuàng)業(yè)公司魔琺科技也于近期舉行了AI戰(zhàn)略分享會(huì)。

      去年8月,魔琺科技在其3D虛擬人AIGC消費(fèi)級(jí)產(chǎn)品發(fā)布會(huì)上就推出過魔琺有言視頻AIGC平臺(tái) 。

      魔琺科技創(chuàng)始人兼CEO柴金祥介紹,目前有言的AIGC能力包含三維動(dòng)畫、 三維超寫實(shí)形象、三維運(yùn)鏡和聲音,能夠一鍵生成場(chǎng)景、運(yùn)鏡、動(dòng)畫、聲音等元素,已在培訓(xùn)、電商、金融、快消、廣電等多個(gè)行業(yè)場(chǎng)景里有落地應(yīng)用。

      總體來看,不同于Sora在創(chuàng)業(yè)類場(chǎng)景里的挖掘,目前國(guó)內(nèi)企業(yè)的動(dòng)向偏向已有產(chǎn)品的能力升級(jí)和ToB場(chǎng)景的應(yīng)用挖掘。

      02

      視頻AIGC的不同路徑

      從公開資料看,國(guó)內(nèi)企業(yè)目前入局視頻AIGC賽道的,多數(shù)與OpenAI的Sora的技術(shù)路線并不一致。

      OpenAI在官網(wǎng)透露過Sora的技術(shù)實(shí)現(xiàn)——“通過一次性為模型提供多幀的預(yù)測(cè),我們解決了一個(gè)具有挑戰(zhàn)性的問題。我們正在教AI理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型來幫助人們解決需要現(xiàn)實(shí)世界交互的問題。”

      業(yè)界認(rèn)為這種方法與之前ChatGPT的Scaling Law是一致的。360創(chuàng)始人周鴻祎點(diǎn)評(píng),OpenAI實(shí)現(xiàn)了用一個(gè)架構(gòu)對(duì)文字、圖片、視頻、音頻進(jìn)行統(tǒng)一處理。他認(rèn)為,過去很多多模態(tài)模型是縫合怪,一個(gè)模型處理圖片,一個(gè)模型處理視頻,模型之間互相不能打通。而OpenAI的Sora則依然和之前的ChatGPT是一種路線,他認(rèn)為這種大力出奇跡的方式,通過大量提升訓(xùn)練參數(shù)的量級(jí),實(shí)現(xiàn)了令人驚艷的效果。

      此前海外的玩家Pika和Runway基本也走的是利用大規(guī)模語料素材去訓(xùn)練,而后預(yù)測(cè)生成的路線,國(guó)內(nèi)的玩家里目前七火山也走了這條路。

      有媒體分析,Etna和Sora同樣采用了Diffusion+Transform架構(gòu),同時(shí)Etna加入了處理高分辨率視頻時(shí)更高效,有助于減少計(jì)算資源和內(nèi)存的需求的卷積神經(jīng)網(wǎng)絡(luò)層。

      觀察人士分析,七火山是從算力投入和商業(yè)層面考量,追求更高的分辨率和幀數(shù),舍去了生成更長(zhǎng)視頻的可能。因而它在對(duì)外公開的特色上強(qiáng)調(diào)生成視頻的幀數(shù)和分辨率超過了Sora。

      多數(shù)國(guó)內(nèi)的文生視頻玩家走的不是這一條路。比如因賽集團(tuán),從此前因賽集團(tuán)對(duì)外釋放出的信息來看,他們的做法偏向從素材查找、內(nèi)容管理和視頻剪輯等核心環(huán)節(jié),利用AIGC技術(shù)解決傳統(tǒng)視頻處理方式費(fèi)時(shí)繁瑣等難題,而非預(yù)測(cè)生成。

      魔琺科技創(chuàng)始人柴金祥則從2D視頻和3D視頻的應(yīng)用場(chǎng)景角度來區(qū)分了該公司的AIGC視頻產(chǎn)品有言和Sora之間的差異。

      柴金祥介紹,目前,Sora生成的內(nèi)容雖然有些場(chǎng)景看上去很立體,但他認(rèn)為Sora并沒有嵌入游戲引擎,知識(shí)訓(xùn)練時(shí)學(xué)習(xí)了一些3D場(chǎng)景的數(shù)據(jù),這些視頻的類型還是2D場(chǎng)景。

      而魔琺有言生成的視頻,通過物理引擎渲染完成,放在vision Pro里,直接能看3D內(nèi)容。未來隨著空間計(jì)算時(shí)代的到來,三維內(nèi)容相比2D視頻內(nèi)容能帶來更好的沉浸感和體驗(yàn)。

      同時(shí),目前Sora生成的視頻,更偏創(chuàng)意類的視頻,這一類視頻容錯(cuò)率高,同樣的文本可以生成出100個(gè)版本的內(nèi)容。

      但柴金祥認(rèn)為,除了創(chuàng)意類視頻,視頻生成類場(chǎng)景當(dāng)下還有大量的需求來自以高密度信息傳遞為主的企業(yè)級(jí)場(chǎng)景。

      例如,企業(yè)內(nèi)外部信息傳達(dá)的視頻制作需求,其中涉及到企業(yè)形象和產(chǎn)品信息傳遞。這些視頻里的信息密度特別大,同時(shí)企業(yè)通常要求輸出的內(nèi)容高度可控,能編輯和調(diào)整,目前他們的產(chǎn)品有言也是從這個(gè)場(chǎng)景切入市場(chǎng)。

      03

      產(chǎn)品化和落地潛力

      Sora最新釋出的創(chuàng)意短片看起來已經(jīng)能表達(dá)出完整的創(chuàng)意內(nèi)容,但一些業(yè)內(nèi)人士認(rèn)為,這個(gè)產(chǎn)品仍處于Demo和完善階段。

      一位AIGC創(chuàng)業(yè)者點(diǎn)評(píng)稱,以黃氣球代替人臉可能是取巧的做法,Sora現(xiàn)在可能還不能很好支持人物面部的一致性,因?yàn)楝F(xiàn)階段模型依然很難完全理解現(xiàn)實(shí)物理世界的時(shí)空規(guī)律。

      還有人判斷,片子看起來像經(jīng)過了后期剪輯,不過由于它完整呈現(xiàn)了文字內(nèi)容的意義,整體看起來很有視覺沖擊力。

      相比OpenAI從創(chuàng)意激發(fā)層面強(qiáng)調(diào)Sora的能力,國(guó)內(nèi)視頻AIGC領(lǐng)域里創(chuàng)業(yè)者們則非常重視和強(qiáng)調(diào)落地性。

      柴金祥認(rèn)為,國(guó)內(nèi)的大模型落地探索,對(duì)企業(yè)來說非常重要的一件事是PMF(Product Market Fit,指產(chǎn)品和市場(chǎng)達(dá)到最佳的契合點(diǎn)),要看企業(yè)能否找到與市場(chǎng)更契合的產(chǎn)品。

      內(nèi)容生產(chǎn)工具賽道,過去十年,B端市場(chǎng)里有Canva、 Figma這樣的產(chǎn)品一旦到了產(chǎn)品和市場(chǎng)匹配,增長(zhǎng)就很快。

      目前,在國(guó)內(nèi)企業(yè)級(jí)市場(chǎng)的視頻生成場(chǎng)景里,柴金祥認(rèn)為,能精準(zhǔn)控制從人物形象、輸出的內(nèi)容和場(chǎng)景等各種信息,最終能生成高質(zhì)量的視頻的AIGC模式,更適合在企業(yè)端去落地,這些場(chǎng)景里信息密度一般比較高,信息需要精準(zhǔn)。

      柴金祥提及,國(guó)內(nèi)電商、短視頻和直播的應(yīng)用生態(tài)領(lǐng)先全球,因此許多視頻AIGC場(chǎng)景也是從這些場(chǎng)景出發(fā),來尋找空間。

      以他們此前服務(wù)B端客戶為例,一個(gè)超寫實(shí)虛擬人實(shí)現(xiàn)成本在幾十萬上下,幫客戶制作一條視頻成本往往要幾十萬元,并且時(shí)間周期要一兩個(gè)月,超寫實(shí)虛擬人直播成本就更高。因此市場(chǎng)就非常希望有更低成本來做信息傳達(dá)和營(yíng)銷類視頻,魔琺科技目前的產(chǎn)品端也是在這個(gè)方向延伸。

      “技術(shù)如果沒有轉(zhuǎn)變成產(chǎn)品,沒有給用戶帶來很突出的價(jià)值,很難獲得生存空間”,柴金祥說,目前視頻AIGC賽道規(guī);拈T檻很高,而技術(shù)做到產(chǎn)品化后,未來企業(yè)的成本可能更多是GPU成本,更容易實(shí)現(xiàn)規(guī);鲩L(zhǎng)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。