菊樂(lè)股份再次申報(bào)IPO:四度闖關(guān)未果,超七成收入來(lái)自四川傳AI芯片設(shè)計(jì)公司Ampere尋求出售,或放棄IPO引領(lǐng)通用具身新時(shí)代:普渡發(fā)布首款類人形機(jī)器人PUDU D7辦公軟件的超級(jí)英雄?金山WPS AI會(huì)員人數(shù)破百萬(wàn),鴻蒙版全面開(kāi)跑ChatGPT 高級(jí)語(yǔ)音模式或?qū)⒂?月24日全面上線巨人網(wǎng)絡(luò)發(fā)布自研角色大模型GiantGPT、語(yǔ)音大模型BaiLing-TTS合合信息IPO啟航|參編重點(diǎn)行業(yè)標(biāo)準(zhǔn),為用戶信息安全保駕護(hù)航南京市建鄴區(qū)攜手華為云,共筑大模型應(yīng)用新高地貝納利哈倫252 & 哈倫402上線重慶摩展 售1.78萬(wàn)元起2024西門子EDA技術(shù)峰會(huì):開(kāi)啟系統(tǒng)設(shè)計(jì)新時(shí)代假期暢玩“黑神話”,LG電子全家桶煥新升級(jí)體驗(yàn)極致性能抖音電商,流量潮水不退合合信息發(fā)布大模型加速器,破解國(guó)內(nèi)大模型產(chǎn)業(yè)“語(yǔ)料荒”難題共建創(chuàng)新生態(tài)推動(dòng)5G擴(kuò)展 高通錢堃談如何助力新質(zhì)生產(chǎn)力發(fā)展騰訊出品!AI音頻模型 EzAudio AI,讓文本秒變逼真聲音《抖音電商DOU Case年鑒2024》重磅發(fā)布,解鎖CORE經(jīng)營(yíng)實(shí)戰(zhàn)秘訣傳音控股與聯(lián)發(fā)科技攜手共建人工智能聯(lián)合實(shí)驗(yàn)室,加速推進(jìn)端側(cè)AI技術(shù)創(chuàng)新阿里通義萬(wàn)相視頻生成模型“AI生視頻”功能正式上線阿里通義千問(wèn)開(kāi)源Qwen2.5系列模型:Qwen2-VL-72B媲美GPT-4字節(jié)推音樂(lè)生成神器 Seed-Music 支持多樣化輸入和精確控制
  • OpenAI Sora畫的餅,AI行業(yè)集體給它圓了......嗎?

    2024年08月14日 10:52:05   來(lái)源:松果財(cái)經(jīng)

      AI文生視頻領(lǐng)域,幾乎只剩Sora還是個(gè)期貨了。

      最近兩個(gè)月,國(guó)內(nèi)外的AI-generated Video應(yīng)用持續(xù)爆發(fā),中國(guó)的快手、字節(jié)、智譜AI、生數(shù)科技、愛(ài)詩(shī)科技,海外的谷歌、Luma、Runway,格局如八仙過(guò)海。

      雖然不同平臺(tái)水平差異依舊存在,但整體可用性已經(jīng)大大提高,而且風(fēng)格化特征也比較全面。唯一的缺憾是,在融入工作流方面,AI視頻工具們的水平還是差了一點(diǎn)。Sora畫的餅,要交給這些后來(lái)者去圓了。

      放棄期貨,文生視頻應(yīng)用爆發(fā)

      業(yè)界民間都把視頻視為AI應(yīng)用落地的重點(diǎn)領(lǐng)域。英偉達(dá)CEO黃仁勛在7月30日的全球頂級(jí)計(jì)算機(jī)圖形學(xué)會(huì)議SIGGRAPH 2024上邀請(qǐng)了Meta的CEO扎克伯格進(jìn)行對(duì)話,雙方都認(rèn)可視頻能力會(huì)是AI大模型的進(jìn)化方向。

      出身于英偉達(dá)研究小組的Luma AI首席科學(xué)家宋佳銘,在與a16z合伙人Anjney Midha對(duì)談時(shí)說(shuō),視頻關(guān)聯(lián)著3D世界,從學(xué)習(xí)角度看,視頻數(shù)據(jù)使模型更好地理解和推理3D世界。所以,實(shí)時(shí)高質(zhì)量的視頻生成,最終會(huì)推動(dòng)具身AI的發(fā)展。

      視頻就是這樣一座“橋”,而現(xiàn)在大量的AI公司正在試圖搶先通過(guò)它,尤其是OpenAI讓Sora變成了外界用不到的期貨,給了其他平臺(tái)進(jìn)一步發(fā)展的空間。

      超長(zhǎng)戰(zhàn)線背后是這些公司的試探。一部分是關(guān)于商業(yè)模式,另一部分是關(guān)于技術(shù)應(yīng)用前景。

      可靈、即夢(mèng)、Vidu等都推出了會(huì)員訂閱模式,在C端進(jìn)行應(yīng)用普及化嘗試。愛(ài)詩(shī)科技創(chuàng)始人王長(zhǎng)虎此前在接受財(cái)新采訪時(shí)表示:“愛(ài)詩(shī)目前的策略以2C(面向消費(fèi)者)為主,廣泛收集國(guó)內(nèi)外用戶反饋,以更好地基于用戶體驗(yàn)迭代底層模型。”至于更遠(yuǎn)的應(yīng)用,現(xiàn)在來(lái)談則為時(shí)尚早,主要是因?yàn)镃端的收費(fèi)模式無(wú)法承擔(dān)成本。

      Luma AI采取了To C的產(chǎn)品形態(tài),不過(guò)它原本專注于3D領(lǐng)域,進(jìn)入視頻生成領(lǐng)域是為了探索3D生成與重建的更多可能性,以視頻驅(qū)動(dòng)3D發(fā)展。這在產(chǎn)業(yè)領(lǐng)域有更多的應(yīng)用前景,例如批量制造電影需要的三維素材等。

      最重要的是,Luma AI的期望不是售賣技術(shù)或者素材,而是建立類似TikTok這樣的平臺(tái),也就是一個(gè)基于3D的生態(tài)系統(tǒng)。王長(zhǎng)虎也在和極客公園創(chuàng)始人張鵬對(duì)話時(shí)表示,愛(ài)詩(shī)科技也瞄準(zhǔn)的是“AIGC時(shí)代的平臺(tái)性機(jī)會(huì)”,但平臺(tái)的形態(tài)暫時(shí)無(wú)法預(yù)測(cè),因?yàn)锳I產(chǎn)業(yè)不會(huì)以復(fù)制現(xiàn)在已有的平臺(tái)的方式成長(zhǎng)。

      不僅如此,目前讓AI-generated Video進(jìn)入完整工作流的應(yīng)用已經(jīng)在成形。開(kāi)源視頻編輯工具Clapper最近熱度上升,它的特色就是集合各類AI技術(shù),用prompt的方式調(diào)動(dòng)AI Agent生成和迭代故事,直接跳過(guò)了手工編輯文件的過(guò)程。

      由此可見(jiàn),AI-generated Video的進(jìn)化速度遠(yuǎn)比我們想象得要快。目前,行業(yè)的重點(diǎn)無(wú)疑在于生成速度和生成效率兩個(gè)方面。但是,大模型并不提供完全確定的商業(yè)模式方向,這更多取決于團(tuán)隊(duì)的選擇。而在這個(gè)過(guò)程中,除了商業(yè)化之外,AI公司還要思考怎么避免陷入合規(guī)困境、成本困境。所以,把文生視頻變得成熟并不容易,現(xiàn)在僅僅相當(dāng)于ChatGPT剛剛問(wèn)世的階段。

      AI-generated Video的“硬傷”和突破口

      a16z之前就發(fā)表過(guò)觀點(diǎn),巨頭在從科研成果到商業(yè)產(chǎn)品的轉(zhuǎn)化中需要更關(guān)注法律安全、版權(quán)等問(wèn)題,所以往往效率會(huì)慢。我們不去考慮Sora是不是因?yàn)檫@個(gè)原因始終不露面,單看行業(yè)都要面對(duì)的相關(guān)問(wèn)題,邏輯其實(shí)是一樣的。

      1.商業(yè)化的“落差”,目前的AI-generated Video很難滿足甲方們的需求

      彭博社曾報(bào)道,OpenAI一直試圖向好萊塢推薦Sora,但并不成功。用Sora制作的第一則商業(yè)化廣告是6月公開(kāi)的玩具反斗城廣告。然而,這則視頻不但用了一些舊素材,公開(kāi)新聞稿也沒(méi)有說(shuō)完全由AI生成。

      導(dǎo)演Nik Kleverov還在一條已經(jīng)刪除的動(dòng)態(tài)里表示,制作這些鏡頭的創(chuàng)意機(jī)構(gòu)Native Foreign提供了大約十幾個(gè)工作人員參與工作,Sora支持了80%到85%的流程。這對(duì)需要高效低成本的AI-generated Video來(lái)說(shuō)算不上什么好消息。

      2.訓(xùn)練成本、高質(zhì)量數(shù)據(jù)集難以滿足

      視頻的本質(zhì)可以視為一系列圖像,圖像有很多公開(kāi)的數(shù)據(jù)集,但是視頻沒(méi)有。OpenAI遇到過(guò)違規(guī)使用YouTube視頻進(jìn)行訓(xùn)練的指控,英偉達(dá)最近被媒體曝光從Netflix和YouTube收集了大量數(shù)據(jù),用來(lái)訓(xùn)練自己的Cosmos項(xiàng)目,用于支持其AI產(chǎn)品往現(xiàn)實(shí)世界發(fā)展。它每天可以下載相當(dāng)于80年的視頻內(nèi)容。

      這體現(xiàn)了兩個(gè)關(guān)鍵點(diǎn):一是黃仁勛和Luma的觀點(diǎn)類似,AI視頻的發(fā)展確實(shí)對(duì)AI進(jìn)入3D世界意義重大,英偉達(dá)也是這樣做的:文本——圖像——視頻——三維模型——現(xiàn)實(shí)世界。二是視頻數(shù)據(jù)集是個(gè)大問(wèn)題,除了版權(quán)問(wèn)題,這些視頻數(shù)據(jù)還缺乏標(biāo)簽,斯坦福大學(xué)教授Stefano Ermon說(shuō),現(xiàn)階段缺乏篩選和過(guò)濾好視頻的方法,而且篩選后還要考慮它們的標(biāo)簽和描述。

      3.AI資產(chǎn)泡沫的問(wèn)題,AI必須為用戶解決重要復(fù)雜的問(wèn)題才能有價(jià)值,但現(xiàn)在它的發(fā)展成效,遠(yuǎn)遠(yuǎn)不能和互聯(lián)網(wǎng)等技術(shù)當(dāng)年初生時(shí)的情況相比

      Benchmark合伙人Michael Eisenberg在最近的一期訪談中,引用了其好友Atreides Management創(chuàng)始人Gavin Baker關(guān)于大模型發(fā)展的觀點(diǎn):“基礎(chǔ)模型是歷史上貶值最快的資產(chǎn)。”

      他所舉的例子來(lái)自Seeking Alpha的創(chuàng)始人,類似金融領(lǐng)域這種每分鐘都會(huì)進(jìn)行業(yè)務(wù)和數(shù)據(jù)更新的高頻領(lǐng)域,訓(xùn)練出來(lái)的模型只能完成寫報(bào)告之類的常規(guī)工作,但無(wú)法應(yīng)對(duì)數(shù)據(jù)的高速刷新,滿足金融預(yù)測(cè)未來(lái)的需求。

      而且,其他技術(shù)的發(fā)展是確定性的,互聯(lián)網(wǎng)發(fā)展早期雖然泡沫巨大,但已經(jīng)體現(xiàn)了應(yīng)用路徑;而AI渾身都是不確定性。互聯(lián)網(wǎng)發(fā)展的邊際成本幾乎約等于0(或者說(shuō)其中不少都分擔(dān)給了運(yùn)營(yíng)商和用戶),然而AI成長(zhǎng)的邊際成本涉及大量固定資產(chǎn),現(xiàn)在都由創(chuàng)業(yè)者自己承擔(dān),而且越投入邊際改善效應(yīng)越弱。大量的早期投入,很可能是一個(gè)陷阱。

      技術(shù)革命之后必須伴隨產(chǎn)業(yè)革命,產(chǎn)業(yè)革命則需要現(xiàn)象級(jí)產(chǎn)品的引領(lǐng)。AI更需要的是一個(gè)成功的場(chǎng)景。目前看來(lái),AI-generated Video還沒(méi)有拿到這類成果的起色。

      Perplexity的創(chuàng)始人Arin對(duì)此提供了另外一個(gè)觀點(diǎn),那就是基礎(chǔ)模型的價(jià)值本質(zhì)映射著背后團(tuán)隊(duì)的價(jià)值,即Sora之于OpenAI,文心大模型之于百度。不是Sora能革了視頻的命,只是外界相信由OpenAI領(lǐng)導(dǎo)的Sora具備這樣的可能性而已。當(dāng)Sora沒(méi)能提供符合我們預(yù)期的突破時(shí),誰(shuí)能在這個(gè)領(lǐng)域擔(dān)起大任呢?

      由此出發(fā),關(guān)鍵或許在于誰(shuí)能先把AI-generated Video真正融入到某一個(gè)商業(yè)系統(tǒng)的工作流中去,就像Clapper對(duì)視頻制作的探索一樣。而這就是一個(gè)更大的問(wèn)題了,因?yàn)樗婕暗胶推渌I(lǐng)域的融合——氣象、城市、影視、汽車、制造業(yè)。也許Sora會(huì)在今年的某天拿出一個(gè)更具體的成果,也許是其他的創(chuàng)業(yè)公司顛覆了我們對(duì)AI視頻的認(rèn)知。

      來(lái)源:松果財(cái)經(jīng)

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。