近日,人工智能研究公司OpenAI發(fā)布首個文生視頻模型“Sora”。
根據(jù)OpenAI官網(wǎng)介紹,使用Sora可以用文字指令生成長達1分鐘的高清視頻。視頻可以具有多個角色、特定類型的運動、精確主題和背景細節(jié)等復(fù)雜場景。
此次文生視頻模型Sora足夠震撼。業(yè)內(nèi)人士認為,從長遠角度來看,Sora將給廣告業(yè)、電影預(yù)告片、短視頻行業(yè)帶來巨大的顛覆。
從OpenAI官網(wǎng)更新的48個視頻demo來看,Sora不僅能夠準確呈現(xiàn)細節(jié),還能生成具有豐富情感的角色。
據(jù)OpenAI介紹,Sora能夠生成具有多個角色、特定類型的運動以及主題和背景的準確細節(jié)的復(fù)雜場景。該模型不僅了解用戶提出的要求,還了解這些東西在物理世界中的存在方式。
這意味著,如果說GPT能夠通過人類的語言來理解世界,那么Sora則能通過視頻、圖片等多模態(tài)數(shù)據(jù)來理解世界。
根據(jù)OpenAI的技術(shù)報告,Sora的強大得益于大量的數(shù)據(jù)、靈活的編碼、優(yōu)質(zhì)的標注和Transformer+diffusion的架構(gòu)。由于使用Transformer架構(gòu),Sora具有較強的擴展性。
業(yè)內(nèi)人士分析稱,此前這類模型對視頻的處理往往會分解為時間域和空間域,用處理時間域的模型處理時間域,比如RNN、自回歸模型等。但是,此次OpenAI直接把整個視頻看做一個整體,一次性輸入到diffusion模型中,讓模型一次性生成出整個視頻的每個細節(jié)。
影視行業(yè)或迎巨變
據(jù)了解,在OpenAI的Sora之前,谷歌曾在去年12月發(fā)布了一個全新的視頻生成模型VideoPoet,能夠執(zhí)行包括文本到視頻、圖像到視頻、視頻風(fēng)格化等操作。而此前一夜爆紅的文生視頻軟件Pika也掀起了AI視頻應(yīng)用的熱潮。
對于此次的Sora問世,360集團創(chuàng)始人、董事長周鴻祎表示,這意味著AGI實現(xiàn)將從10年縮短至1年。具備文生視頻功能的視頻類生成式AI,能夠有效降低創(chuàng)作者的創(chuàng)作門檻。
國海證券在研報中指出,根據(jù)《AIGC/AI生成內(nèi)容產(chǎn)業(yè)展望報告》,視頻生成將成為近期跨模態(tài)生成領(lǐng)域的中高潛力場景,其背后邏輯是不同技術(shù)帶來的主流內(nèi)容形式的變化。
英偉達高級科學(xué)家Jim Fan認為,2022年是影像之年,2023是聲波之年,而2024是視頻之年。
大“網(wǎng)紅”馬斯克也對OpenAI發(fā)布的新模型發(fā)表了評價。針對推特網(wǎng)友轉(zhuǎn)發(fā)的Sora演示視頻,配文聲稱“gg Pixar”,馬斯克在推文下方留言表示,“gg humans”。
另有一名網(wǎng)友談及OpenAI的新模型,并將話題引向影視行業(yè),“電影行業(yè)肯定會對這種技術(shù)做出嚴厲反應(yīng),希望法規(guī)不會失控”、“與大多數(shù)類型AI創(chuàng)作不同,生成式藝術(shù)不會抑制人類的精神”。
馬斯克針對該推文也做出回應(yīng),“由人工智能增強的人類,將會在未來幾年之內(nèi)創(chuàng)作出最杰出的作品”。
能否帶來顛覆性影響?
從OpenAI官網(wǎng)公布的視頻實例來看,Sora能夠精準呈現(xiàn)視頻細節(jié)。
比如,某個Prompt的提示詞是美麗、白雪皚皚的東京、城市熙熙攘攘。鏡頭穿過城市街道,跟隨幾個人享受美麗的雪天,在附近的攤位上購物。
在Sora生成的視頻里,鏡頭從俯視白雪覆蓋的東京,慢慢推進到兩個行人手牽手在街道上行走,街旁的櫻花樹和商鋪的畫面均得以呈現(xiàn)。
有業(yè)內(nèi)人士表示,這對電影、動漫、小說、游戲等行業(yè)具有深遠影響。不過也有視頻剪輯從業(yè)人員潑冷水,“大規(guī)模應(yīng)用后能否催生更多好作品尚不清楚,但制造視頻垃圾的速度一定會呈現(xiàn)指數(shù)級增長”。
某互聯(lián)網(wǎng)從業(yè)人員表示,Sora確實很牛,但如果認為三年后就沒人拍視頻了,認為抖音Tiktok很快會被顛覆,那還是為時過早。
如果想借助Sora將視頻行業(yè)變成“人純粹消費機器工業(yè)化內(nèi)容”的局面,這恐怕沒戲。如果借助新技術(shù),讓人與人之間產(chǎn)生新的連接,激發(fā)新的創(chuàng)作產(chǎn)能,這是有戲的。同時,需要尊重行業(yè)規(guī)律,通過技術(shù)迭代生態(tài),而不是直接把技術(shù)丟給用戶。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。