5G確定性工業(yè)基站首商用,工業(yè)互聯(lián)網(wǎng)走上新高度李飛飛團隊前瞻性研究 多模態(tài)AI模型初顯空間智能AI終于邁過這道檻!Livekit 開源模型精準識別“你是否說完”!DeepSeek開源大模型開發(fā)者之一羅福莉?qū)⒓用诵∶?/a>廣汽詳解旗下首款復合翼飛行汽車 GOVY AirJet:最高飛行速度可達 250km/h清華大學聯(lián)合騰訊出品!ColorFlow:自動給黑白漫畫上色,保持角色一致性Adobe推新AI音頻具Sketch2Sound ,只需哼唱和模仿聲音就能創(chuàng)建音效家庭能源智聯(lián)自由 海辰儲能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o3:AI 推理能力的重大突破,得分高達87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團外賣出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動6000億GTV后,抖音計劃偷襲美團大本營AGI Open Network(AON):賦能每個人創(chuàng)建、部署和貨幣化AI Agent貸款利率史上最低了嗎?東融教你看懂歷年啥水平“客服來電”有詐?抖音客服上線“驗證助手”助用戶識別詐騙OpenAI新模型GPT-5研發(fā)未達預期:成本高昂 效果不佳曝天馬打入果鏈:為蘋果HomePod供應LCD屏 每塊屏僅10美元曝OPPO或首發(fā)新款天璣次旗艦芯片 兩大子品牌Q2發(fā)力諾基亞攜手阿聯(lián)酋運營商e&,展示全球首個固網(wǎng)游戲端到端網(wǎng)絡(luò)切片方案
  • 首頁 > 云計算頻道 > 大模型

    Sora火了,抖音們慌了?

    2024年02月22日 11:40:48   來源:定焦公眾號

      Sora有多火?

      馬斯克、楊立昆、賈揚清、Jim Fan、謝賽寧等各路大佬都在討論,周鴻祎更是喊出,Sora的誕生意味著AGI(通用人工智能)的實現(xiàn)或從十年縮短至一兩年。

      不少“普通人”也提前嗅到商機,圍繞Sora搞錢的生意先火了。有媒體報道,一張網(wǎng)傳截圖顯示,某機構(gòu)已售出2萬多份Sora培訓課程,輕松到手200萬。

      如今,距離2月16日OpenAI發(fā)布文生視頻大模型Sora已經(jīng)過去快一周,但討論依舊熱烈,這實在是因為它過于優(yōu)秀。

      功能上,它能生成長達60秒的視頻內(nèi)容,遠超其他文生視頻工具幾秒至十幾秒的限額;它還能進行自我編輯和擴展,將兩個不相關(guān)的內(nèi)容過渡在一起,能轉(zhuǎn)換主角周圍的風格和環(huán)境等;

      前景上,Sora不僅是視頻生成工具,它更被視為世界模擬器;

      創(chuàng)始團隊上,也堪稱傳奇,核心成員包括12人,成立尚未超過1年,由兩名剛剛畢業(yè)的博士生帶隊,其中還有00后。

      在興奮之余,Sora的強大也讓一些內(nèi)容創(chuàng)作者有了危機意識,有網(wǎng)友評價,“長短視頻、游戲行業(yè)的朋友們一整年都不會快樂了。”

      多位業(yè)內(nèi)人士指出,以目前Sora生成視頻的長度來看,它的到來最先會沖擊到短視頻領(lǐng)域。一旦大范圍推廣,Sora將大大降低短視頻創(chuàng)作門檻,豐富短視頻平臺的內(nèi)容供給,但隨之而來的問題是,AI生成內(nèi)容的增多可能會影響平臺的內(nèi)容生態(tài),同時Sora還會和剪映、快影等工具搶奪用戶,讓此前的大筆投入付諸東流。

      Sora朝短視頻領(lǐng)域扔下了一枚重磅炸彈,考驗創(chuàng)作者和抖音快手們的時刻到了。

      Sora降低了門檻,也增加了競爭

      雖然市面上已經(jīng)有不少文成視頻工具,比如Pika、Runway,用戶輸入文字就能得到一段幾秒到十幾秒的視頻內(nèi)容,但目前它們并未被廣泛使用,主要原因還是效果一般。

      某MCN機構(gòu)負責人大成告訴「定焦」,他使用過Runway,“我們還從外部購買了優(yōu)質(zhì)素材,但最終生成的內(nèi)容不夠精良,根本用不了。”

      看到Sora后,他十分激動,“時長能達到60秒,內(nèi)容還合乎邏輯,感覺和之前的工具不在一個層次上。”

      “Sora與此前的同類產(chǎn)品相比,效果好了不止10倍。”人工智能在讀博士、做過相關(guān)大模型研究的牛小博表示。“目前Sora60秒的穩(wěn)定生成效果,將對短視頻行業(yè)帶來革命性影響。”

      研究AI的阿涅也表達了相同觀點,“創(chuàng)作者的門檻被降低,哪怕視頻的可信度還沒那么高,甚至會出現(xiàn)一些錯誤,但不仔細很難看出來,將來技術(shù)也會很快迭代。”

      綜合多位從業(yè)者的說法,Sora直接解決了文生視頻領(lǐng)域的兩大難題,準確性和一致性。

      AI研究者Cyrus的感受是,與之前的工具相比,“Sora就像三體人打原始人”。

      所謂準確性,指生成的視頻能準確識別用戶輸入的文字需求,一致性是指,在運動過程中,主角在多視角運動變化中內(nèi)容連貫,不會發(fā)生形變,同時其變化還能遵循物理規(guī)律。最明顯的表現(xiàn)是,主角和背景的互動符合邏輯。

      一年前,牛小博和團隊還在探討生成式AI無法了解空間尺度,比如生成圖尺寸不對,但他們覺得,Sora的出現(xiàn)已經(jīng)解決了這個問題。

      有人用視頻還原物理空間模型,發(fā)現(xiàn)也能夠?qū),牛小博覺得這證明了Sora的空間計算能力基本正確,而人對空間的感知很大一部分也依靠視覺。

      從這個角度看,Sora生成的視頻背后,有物理空間的邏輯支撐。

      綜合多位受訪者的觀點和多位科技界大佬的公開發(fā)言,盡管還有瑕疵,但Sora給視頻乃至整個人工智能領(lǐng)域的重大突破在于,這是一個更智能、甚至具備一定思維能力的模型,其生成的視頻能理解物理世界的客觀規(guī)律。

      這也讓一批做短視頻內(nèi)容的從業(yè)者開始思考,Sora到底會不會搶自己的飯碗?

      我們把現(xiàn)有的短視頻簡單分為兩類,一類由真人出鏡,往往真人就是一個賬號甚至一家公司的“核心資產(chǎn)”,Sora對這類內(nèi)容的沖擊并不大;另一類由素材集合而成,考驗拍攝、創(chuàng)意能力。Sora的出現(xiàn),將大大提升這類視頻的生產(chǎn)效率。

      一些想要提高產(chǎn)量的創(chuàng)作者,非常期待Sora的到來。

      大成表示,這類工具完全可以取代公司的低端勞動。“我們公司體量小,為了節(jié)省成本招了很多大學生,但他們剛畢業(yè),半天憋不出一個文案,用了AI,幾分鐘就能寫出上百條。”

      去年他和團隊就開始大規(guī)模使用AI工具了,“雖然這些工具還不成熟,但處理文案和粗剪,都很好用。作為一家視頻生產(chǎn)商,一定要提高效率。”他表示。

      對于一些有創(chuàng)意的團隊來說,則認為短期內(nèi)Sora不會對他們產(chǎn)生威脅。

      頭部MCN機構(gòu)負責人達克告訴「定焦」,“Sora還沒有開始公測,該技術(shù)離成熟還有很長一段時間,而且我們的視頻主要靠人的創(chuàng)意、頭腦風暴,包括拍攝也是講究創(chuàng)新的,鏡頭如何設(shè)計、如何過渡,都有思考。雖然Sora很強大,但完不成我們目前的創(chuàng)意設(shè)計需求。”他還透露,目前公司沒有使用任何AI工具。

      不過,這些創(chuàng)作者們必須面對的問題是,Sora的出現(xiàn)降低了短視頻創(chuàng)作門檻,會有越來越多的人加入,跟他們搶奪流量和變現(xiàn)機會。

      一名新媒體從業(yè)者表示,他們有內(nèi)容創(chuàng)作能力,但苦于沒有合適的視頻拍攝、剪輯團隊,新的工具出現(xiàn),就是他們的機會。

      綜合多位業(yè)內(nèi)人士的觀點,在類型上,目前Sora對真人出鏡類短視頻影響較小,對動漫類、解說類內(nèi)容影響比較大,甚至會淘汰很多沒有創(chuàng)意、只蹭熱點的批量做號公司。在崗位上,部分做機械性重復工作的人員可能會面臨淘汰,但創(chuàng)意類人員會被提至更高位置。

      總之,未來做短視頻,參與者更多,競爭也更激烈。

      抖音快手們會慌嗎?

      Sora的出現(xiàn),將給短視頻平臺帶來更加豐富的供給,但同時也讓抖音快手們面臨新的考驗。

      從業(yè)者表示,一方面,AI生成視頻過多,會對短視頻平臺原有的內(nèi)容生態(tài)造成沖擊,另一方面,Sora的火爆,會搶走一部分抖音、快手旗下剪映、快影等工具的用戶。

      達克告訴「定焦」,AI生成的內(nèi)容在上傳短視頻平臺時,需要特殊標注。

      去年5月,抖音就發(fā)布了《抖音關(guān)于人工智能生成內(nèi)容的平臺規(guī)范暨行業(yè)倡議》,這一倡議提出,要對該類內(nèi)容進行顯著標識,虛擬人使用者需要實名認證,同時對利用AI工具創(chuàng)作、發(fā)布侵犯肖像權(quán)、弄虛作假等內(nèi)容進行嚴格處罰。

      快手、小紅書等平臺也有相關(guān)的限制。今年2月,小紅書官方發(fā)布AI創(chuàng)作內(nèi)容的規(guī)范,要求創(chuàng)作者主動聲明AI創(chuàng)作內(nèi)容、不能用AI創(chuàng)作內(nèi)容虛構(gòu)使用體驗進行商業(yè)變現(xiàn)等。

      多位從業(yè)者表示,他們能夠明顯感覺到,平臺在控制該類內(nèi)容,甚至會限流。

      “AI創(chuàng)作的內(nèi)容同質(zhì)化嚴重,且創(chuàng)意性不高,用戶一旦刷到太多相似內(nèi)容,就會變得不耐煩,甚至轉(zhuǎn)戰(zhàn)其他平臺。”一位互聯(lián)網(wǎng)行業(yè)觀察者表示。

      他還覺得,“如果平臺對這類內(nèi)容不做限制,越來越多創(chuàng)作者也會圖省事使用AI,這會嚴重影響到平臺各類內(nèi)容占比,最直觀的是,一些獨有的、稀缺的視頻會減少。”

      以及還有可能會誕生大量虛假視頻。Sora能快速生產(chǎn)大量逼真的短視頻,也讓造假變得輕而易舉,一些用戶對該類內(nèi)容難辨真?zhèn)危坏┍或_,平臺公信力也會受到嚴重影響。去年,利用文生圖、AI換臉等AI生成內(nèi)容進行詐騙的案件就被曝出不少。

      在Cyrus看來,如果平臺扶持AI創(chuàng)作類內(nèi)容,很像“為他人做嫁衣” ,結(jié)果就是影響用戶留存。“設(shè)想一下,如果小紅書上全是字節(jié)豆包大模型生產(chǎn)的內(nèi)容,用戶為什么不直接刷抖音呢?反之亦然。”

      Cyrus預測,抖音、快手、小紅書、B站上,不會大量推薦AI創(chuàng)作的內(nèi)容。除非是平臺自己做的文生視頻大模型,在自家進行大范圍推廣后,進行單獨變現(xiàn)。“比如當其優(yōu)化到一定程度,可以直接走用戶付費模式,但各家的產(chǎn)品目前都不具備這一能力。”

      不止一位業(yè)內(nèi)人士推斷,Sora和其他AI視頻創(chuàng)作工具之間的差距會越來越大,此前,“Sora會不會殺死剪映”的話題就曾引發(fā)熱議。Sora如果被大規(guī)模應用,大多數(shù)AI工具可能會被市場拋棄,其他公司前期的大筆投入將付諸東流。

      為什么差距會拉大?

      周鴻祎曾公開指出,國內(nèi)的大模型發(fā)展水平表面上看接近GPT-3.5,實際上離4.0還有一年半的差距。牛小博從技術(shù)端給出解釋,Sora不是一個點狀技術(shù),而是一個復雜的系統(tǒng)工程。即便外界知道其核心技術(shù)是transformer注意力算法+diffusion的擴散算法等,但其背后是OpenAI給予的資金支持和積累的超強數(shù)據(jù)。

      OpenAI通過積累的GPT通用語言模型加上DALL-E3圖像生成模型,發(fā)展出視頻能夠理解圖片內(nèi)容,到Sora的時候,又提升了一致性和物理空間理解能力,這每一步的積累,缺一不可。

      更大的預測更是讓抖音們前路難料。有影視從業(yè)者認為,Sora被大范圍使用后,有可能會出現(xiàn)比抖音更大的新平臺。

      在一部分人看來,Sora降低了用戶門檻,必然導致內(nèi)容創(chuàng)作者數(shù)量級猛增,而抖音這樣的短視頻平臺,其體量、內(nèi)容創(chuàng)作和推送的邏輯規(guī)則,能否承載該類內(nèi)容很難說,很可能會誕生一個與Sora更相符合的平臺。

      牛小博通過觀察互聯(lián)網(wǎng)行業(yè)的發(fā)展,也贊同這一觀點。“互聯(lián)網(wǎng)在早期是專業(yè)用戶使用,后來PC的普及擴大了用戶,接著智能手機出現(xiàn),人人可以聯(lián)網(wǎng),以至于服務(wù)各類人群需求的平臺都出來了。也許隨著Sora使用人群的增加,會有新的生態(tài)出現(xiàn)。”

      Sora影響巨大,但不必神化

      目前,Sora還沒有開放公測,只有一些視覺藝術(shù)家、電影制作人、OpenAI員工等人士獲得了訪問權(quán)限。一部分原因是,Sora并非完美無缺。它對短視頻的沖擊,還沒有完全展現(xiàn)。

      AI訓練師小剛指出,Sora存在大模型普遍存在的“幻覺問題”,它在理解物理規(guī)律、人與物體交互等方面還存在缺陷。

      比如OpenAI官網(wǎng)公布了一些缺陷視頻,包括蠟燭吹不滅、投籃時籃球在下落過程中爆炸,以及挖出來的椅子直接漂起來等不符合物理規(guī)律的內(nèi)容,這是因為Sora的理解還不夠成熟,誤以為從沙子里挖出來的東西,一般都比較輕。

      而具體到短視頻行業(yè),小剛認為Sora最重要的一個不足是,還做不到人物固定。

      舉個例子,比如創(chuàng)作者用Sora生成了一條60秒的視頻,畫面中主角為A,但其在生成下一個視頻后,主角很可能就換成了B。

      相比Pika、Runway,大家能看到Sora的空間能力很強,但內(nèi)容再短,做不到人物固定就沒有意義,用戶持續(xù)在短視頻平臺觀看內(nèi)容,無論是真人還是動畫,都需要一個中心人物保證故事的延續(xù)性。

      以及算力問題,也讓很多人擔憂Sora的普及速度。畢竟技術(shù)突破再大,如果成本過高,還是難以被大眾接受。多名業(yè)內(nèi)人士認為,這是目前Sora面臨的最大困難。

      “目前OpenAI沒有公布Sora具體的算力、能源消耗需求以及參數(shù)量。初步判斷,它需要的數(shù)據(jù)量、算力以及大量的能源消耗將是巨大成本,而這與其下個階段的廣泛推廣必然存在矛盾。”牛小博認為。

      每一次新技術(shù)的出現(xiàn),都會引發(fā)一場新舊交替的大討論。

      虛擬拍攝技術(shù)剛誕生時,為影視行業(yè)節(jié)省了拍攝成本,但傳統(tǒng)的拍攝方式至今仍然存在。OpenAI推出ChatGPT一年多以來,文字從業(yè)者也沒有被替代,反而讓更多人意識到優(yōu)質(zhì)內(nèi)容創(chuàng)作者的價值。

      同理,Sora對市場上同類AI工具帶來了沖擊,但它再強,淘汰的更多是沒有創(chuàng)意、只想走量的短視頻從業(yè)者,或是不會使用這類工具的人。

      至于Sora是否會顛覆整個短視頻行業(yè),會不會誕生下一個超級平臺,目前大家還在觀望,需要看Sora能否迅速解決現(xiàn)有問題,以及國內(nèi)有沒有新的挑戰(zhàn)者誕生。

      *題圖及文中配圖來源于Sora官網(wǎng)。應受訪者要求,文中達克為化名。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。