合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機器也能說人話了?
  • 首頁 > 云計算頻道 > 大模型

    Sora火了,抖音們慌了?

    2024年02月22日 11:40:48   來源:定焦公眾號

      Sora有多火?

      馬斯克、楊立昆、賈揚清、Jim Fan、謝賽寧等各路大佬都在討論,周鴻祎更是喊出,Sora的誕生意味著AGI(通用人工智能)的實現(xiàn)或從十年縮短至一兩年。

      不少“普通人”也提前嗅到商機,圍繞Sora搞錢的生意先火了。有媒體報道,一張網(wǎng)傳截圖顯示,某機構(gòu)已售出2萬多份Sora培訓(xùn)課程,輕松到手200萬。

      如今,距離2月16日OpenAI發(fā)布文生視頻大模型Sora已經(jīng)過去快一周,但討論依舊熱烈,這實在是因為它過于優(yōu)秀。

      功能上,它能生成長達60秒的視頻內(nèi)容,遠超其他文生視頻工具幾秒至十幾秒的限額;它還能進行自我編輯和擴展,將兩個不相關(guān)的內(nèi)容過渡在一起,能轉(zhuǎn)換主角周圍的風(fēng)格和環(huán)境等;

      前景上,Sora不僅是視頻生成工具,它更被視為世界模擬器;

      創(chuàng)始團隊上,也堪稱傳奇,核心成員包括12人,成立尚未超過1年,由兩名剛剛畢業(yè)的博士生帶隊,其中還有00后。

      在興奮之余,Sora的強大也讓一些內(nèi)容創(chuàng)作者有了危機意識,有網(wǎng)友評價,“長短視頻、游戲行業(yè)的朋友們一整年都不會快樂了。”

      多位業(yè)內(nèi)人士指出,以目前Sora生成視頻的長度來看,它的到來最先會沖擊到短視頻領(lǐng)域。一旦大范圍推廣,Sora將大大降低短視頻創(chuàng)作門檻,豐富短視頻平臺的內(nèi)容供給,但隨之而來的問題是,AI生成內(nèi)容的增多可能會影響平臺的內(nèi)容生態(tài),同時Sora還會和剪映、快影等工具搶奪用戶,讓此前的大筆投入付諸東流。

      Sora朝短視頻領(lǐng)域扔下了一枚重磅炸彈,考驗創(chuàng)作者和抖音快手們的時刻到了。

      Sora降低了門檻,也增加了競爭

      雖然市面上已經(jīng)有不少文成視頻工具,比如Pika、Runway,用戶輸入文字就能得到一段幾秒到十幾秒的視頻內(nèi)容,但目前它們并未被廣泛使用,主要原因還是效果一般。

      某MCN機構(gòu)負(fù)責(zé)人大成告訴「定焦」,他使用過Runway,“我們還從外部購買了優(yōu)質(zhì)素材,但最終生成的內(nèi)容不夠精良,根本用不了。”

      看到Sora后,他十分激動,“時長能達到60秒,內(nèi)容還合乎邏輯,感覺和之前的工具不在一個層次上。”

      “Sora與此前的同類產(chǎn)品相比,效果好了不止10倍。”人工智能在讀博士、做過相關(guān)大模型研究的牛小博表示。“目前Sora60秒的穩(wěn)定生成效果,將對短視頻行業(yè)帶來革命性影響。”

      研究AI的阿涅也表達了相同觀點,“創(chuàng)作者的門檻被降低,哪怕視頻的可信度還沒那么高,甚至?xí)霈F(xiàn)一些錯誤,但不仔細很難看出來,將來技術(shù)也會很快迭代。”

      綜合多位從業(yè)者的說法,Sora直接解決了文生視頻領(lǐng)域的兩大難題,準(zhǔn)確性和一致性。

      AI研究者Cyrus的感受是,與之前的工具相比,“Sora就像三體人打原始人”。

      所謂準(zhǔn)確性,指生成的視頻能準(zhǔn)確識別用戶輸入的文字需求,一致性是指,在運動過程中,主角在多視角運動變化中內(nèi)容連貫,不會發(fā)生形變,同時其變化還能遵循物理規(guī)律。最明顯的表現(xiàn)是,主角和背景的互動符合邏輯。

      一年前,牛小博和團隊還在探討生成式AI無法了解空間尺度,比如生成圖尺寸不對,但他們覺得,Sora的出現(xiàn)已經(jīng)解決了這個問題。

      有人用視頻還原物理空間模型,發(fā)現(xiàn)也能夠?qū)?yīng)上,牛小博覺得這證明了Sora的空間計算能力基本正確,而人對空間的感知很大一部分也依靠視覺。

      從這個角度看,Sora生成的視頻背后,有物理空間的邏輯支撐。

      綜合多位受訪者的觀點和多位科技界大佬的公開發(fā)言,盡管還有瑕疵,但Sora給視頻乃至整個人工智能領(lǐng)域的重大突破在于,這是一個更智能、甚至具備一定思維能力的模型,其生成的視頻能理解物理世界的客觀規(guī)律。

      這也讓一批做短視頻內(nèi)容的從業(yè)者開始思考,Sora到底會不會搶自己的飯碗?

      我們把現(xiàn)有的短視頻簡單分為兩類,一類由真人出鏡,往往真人就是一個賬號甚至一家公司的“核心資產(chǎn)”,Sora對這類內(nèi)容的沖擊并不大;另一類由素材集合而成,考驗拍攝、創(chuàng)意能力。Sora的出現(xiàn),將大大提升這類視頻的生產(chǎn)效率。

      一些想要提高產(chǎn)量的創(chuàng)作者,非常期待Sora的到來。

      大成表示,這類工具完全可以取代公司的低端勞動。“我們公司體量小,為了節(jié)省成本招了很多大學(xué)生,但他們剛畢業(yè),半天憋不出一個文案,用了AI,幾分鐘就能寫出上百條。”

      去年他和團隊就開始大規(guī)模使用AI工具了,“雖然這些工具還不成熟,但處理文案和粗剪,都很好用。作為一家視頻生產(chǎn)商,一定要提高效率。”他表示。

      對于一些有創(chuàng)意的團隊來說,則認(rèn)為短期內(nèi)Sora不會對他們產(chǎn)生威脅。

      頭部MCN機構(gòu)負(fù)責(zé)人達克告訴「定焦」,“Sora還沒有開始公測,該技術(shù)離成熟還有很長一段時間,而且我們的視頻主要靠人的創(chuàng)意、頭腦風(fēng)暴,包括拍攝也是講究創(chuàng)新的,鏡頭如何設(shè)計、如何過渡,都有思考。雖然Sora很強大,但完不成我們目前的創(chuàng)意設(shè)計需求。”他還透露,目前公司沒有使用任何AI工具。

      不過,這些創(chuàng)作者們必須面對的問題是,Sora的出現(xiàn)降低了短視頻創(chuàng)作門檻,會有越來越多的人加入,跟他們搶奪流量和變現(xiàn)機會。

      一名新媒體從業(yè)者表示,他們有內(nèi)容創(chuàng)作能力,但苦于沒有合適的視頻拍攝、剪輯團隊,新的工具出現(xiàn),就是他們的機會。

      綜合多位業(yè)內(nèi)人士的觀點,在類型上,目前Sora對真人出鏡類短視頻影響較小,對動漫類、解說類內(nèi)容影響比較大,甚至?xí)蕴芏鄾]有創(chuàng)意、只蹭熱點的批量做號公司。在崗位上,部分做機械性重復(fù)工作的人員可能會面臨淘汰,但創(chuàng)意類人員會被提至更高位置。

      總之,未來做短視頻,參與者更多,競爭也更激烈。

      抖音快手們會慌嗎?

      Sora的出現(xiàn),將給短視頻平臺帶來更加豐富的供給,但同時也讓抖音快手們面臨新的考驗。

      從業(yè)者表示,一方面,AI生成視頻過多,會對短視頻平臺原有的內(nèi)容生態(tài)造成沖擊,另一方面,Sora的火爆,會搶走一部分抖音、快手旗下剪映、快影等工具的用戶。

      達克告訴「定焦」,AI生成的內(nèi)容在上傳短視頻平臺時,需要特殊標(biāo)注。

      去年5月,抖音就發(fā)布了《抖音關(guān)于人工智能生成內(nèi)容的平臺規(guī)范暨行業(yè)倡議》,這一倡議提出,要對該類內(nèi)容進行顯著標(biāo)識,虛擬人使用者需要實名認(rèn)證,同時對利用AI工具創(chuàng)作、發(fā)布侵犯肖像權(quán)、弄虛作假等內(nèi)容進行嚴(yán)格處罰。

      快手、小紅書等平臺也有相關(guān)的限制。今年2月,小紅書官方發(fā)布AI創(chuàng)作內(nèi)容的規(guī)范,要求創(chuàng)作者主動聲明AI創(chuàng)作內(nèi)容、不能用AI創(chuàng)作內(nèi)容虛構(gòu)使用體驗進行商業(yè)變現(xiàn)等。

      多位從業(yè)者表示,他們能夠明顯感覺到,平臺在控制該類內(nèi)容,甚至?xí)蘖鳌?/strong>

      “AI創(chuàng)作的內(nèi)容同質(zhì)化嚴(yán)重,且創(chuàng)意性不高,用戶一旦刷到太多相似內(nèi)容,就會變得不耐煩,甚至轉(zhuǎn)戰(zhàn)其他平臺。”一位互聯(lián)網(wǎng)行業(yè)觀察者表示。

      他還覺得,“如果平臺對這類內(nèi)容不做限制,越來越多創(chuàng)作者也會圖省事使用AI,這會嚴(yán)重影響到平臺各類內(nèi)容占比,最直觀的是,一些獨有的、稀缺的視頻會減少。”

      以及還有可能會誕生大量虛假視頻。Sora能快速生產(chǎn)大量逼真的短視頻,也讓造假變得輕而易舉,一些用戶對該類內(nèi)容難辨真?zhèn),一旦被騙,平臺公信力也會受到嚴(yán)重影響。去年,利用文生圖、AI換臉等AI生成內(nèi)容進行詐騙的案件就被曝出不少。

      在Cyrus看來,如果平臺扶持AI創(chuàng)作類內(nèi)容,很像“為他人做嫁衣” ,結(jié)果就是影響用戶留存。“設(shè)想一下,如果小紅書上全是字節(jié)豆包大模型生產(chǎn)的內(nèi)容,用戶為什么不直接刷抖音呢?反之亦然。”

      Cyrus預(yù)測,抖音、快手、小紅書、B站上,不會大量推薦AI創(chuàng)作的內(nèi)容。除非是平臺自己做的文生視頻大模型,在自家進行大范圍推廣后,進行單獨變現(xiàn)。“比如當(dāng)其優(yōu)化到一定程度,可以直接走用戶付費模式,但各家的產(chǎn)品目前都不具備這一能力。”

      不止一位業(yè)內(nèi)人士推斷,Sora和其他AI視頻創(chuàng)作工具之間的差距會越來越大,此前,“Sora會不會殺死剪映”的話題就曾引發(fā)熱議。Sora如果被大規(guī)模應(yīng)用,大多數(shù)AI工具可能會被市場拋棄,其他公司前期的大筆投入將付諸東流。

      為什么差距會拉大?

      周鴻祎曾公開指出,國內(nèi)的大模型發(fā)展水平表面上看接近GPT-3.5,實際上離4.0還有一年半的差距。牛小博從技術(shù)端給出解釋,Sora不是一個點狀技術(shù),而是一個復(fù)雜的系統(tǒng)工程。即便外界知道其核心技術(shù)是transformer注意力算法+diffusion的擴散算法等,但其背后是OpenAI給予的資金支持和積累的超強數(shù)據(jù)。

      OpenAI通過積累的GPT通用語言模型加上DALL-E3圖像生成模型,發(fā)展出視頻能夠理解圖片內(nèi)容,到Sora的時候,又提升了一致性和物理空間理解能力,這每一步的積累,缺一不可。

      更大的預(yù)測更是讓抖音們前路難料。有影視從業(yè)者認(rèn)為,Sora被大范圍使用后,有可能會出現(xiàn)比抖音更大的新平臺。

      在一部分人看來,Sora降低了用戶門檻,必然導(dǎo)致內(nèi)容創(chuàng)作者數(shù)量級猛增,而抖音這樣的短視頻平臺,其體量、內(nèi)容創(chuàng)作和推送的邏輯規(guī)則,能否承載該類內(nèi)容很難說,很可能會誕生一個與Sora更相符合的平臺。

      牛小博通過觀察互聯(lián)網(wǎng)行業(yè)的發(fā)展,也贊同這一觀點。“互聯(lián)網(wǎng)在早期是專業(yè)用戶使用,后來PC的普及擴大了用戶,接著智能手機出現(xiàn),人人可以聯(lián)網(wǎng),以至于服務(wù)各類人群需求的平臺都出來了。也許隨著Sora使用人群的增加,會有新的生態(tài)出現(xiàn)。”

      Sora影響巨大,但不必神化

      目前,Sora還沒有開放公測,只有一些視覺藝術(shù)家、電影制作人、OpenAI員工等人士獲得了訪問權(quán)限。一部分原因是,Sora并非完美無缺。它對短視頻的沖擊,還沒有完全展現(xiàn)。

      AI訓(xùn)練師小剛指出,Sora存在大模型普遍存在的“幻覺問題”,它在理解物理規(guī)律、人與物體交互等方面還存在缺陷。

      比如OpenAI官網(wǎng)公布了一些缺陷視頻,包括蠟燭吹不滅、投籃時籃球在下落過程中爆炸,以及挖出來的椅子直接漂起來等不符合物理規(guī)律的內(nèi)容,這是因為Sora的理解還不夠成熟,誤以為從沙子里挖出來的東西,一般都比較輕。

      而具體到短視頻行業(yè),小剛認(rèn)為Sora最重要的一個不足是,還做不到人物固定。

      舉個例子,比如創(chuàng)作者用Sora生成了一條60秒的視頻,畫面中主角為A,但其在生成下一個視頻后,主角很可能就換成了B。

      相比Pika、Runway,大家能看到Sora的空間能力很強,但內(nèi)容再短,做不到人物固定就沒有意義,用戶持續(xù)在短視頻平臺觀看內(nèi)容,無論是真人還是動畫,都需要一個中心人物保證故事的延續(xù)性。

      以及算力問題,也讓很多人擔(dān)憂Sora的普及速度。畢竟技術(shù)突破再大,如果成本過高,還是難以被大眾接受。多名業(yè)內(nèi)人士認(rèn)為,這是目前Sora面臨的最大困難。

      “目前OpenAI沒有公布Sora具體的算力、能源消耗需求以及參數(shù)量。初步判斷,它需要的數(shù)據(jù)量、算力以及大量的能源消耗將是巨大成本,而這與其下個階段的廣泛推廣必然存在矛盾。”牛小博認(rèn)為。

      每一次新技術(shù)的出現(xiàn),都會引發(fā)一場新舊交替的大討論。

      虛擬拍攝技術(shù)剛誕生時,為影視行業(yè)節(jié)省了拍攝成本,但傳統(tǒng)的拍攝方式至今仍然存在。OpenAI推出ChatGPT一年多以來,文字從業(yè)者也沒有被替代,反而讓更多人意識到優(yōu)質(zhì)內(nèi)容創(chuàng)作者的價值。

      同理,Sora對市場上同類AI工具帶來了沖擊,但它再強,淘汰的更多是沒有創(chuàng)意、只想走量的短視頻從業(yè)者,或是不會使用這類工具的人。

      至于Sora是否會顛覆整個短視頻行業(yè),會不會誕生下一個超級平臺,目前大家還在觀望,需要看Sora能否迅速解決現(xiàn)有問題,以及國內(nèi)有沒有新的挑戰(zhàn)者誕生。

      *題圖及文中配圖來源于Sora官網(wǎng)。應(yīng)受訪者要求,文中達克為化名。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。