隨著國產(chǎn)公司推出的AI視頻技術(shù)的崛起,短劇市場迎來了新的變革。七火山公司在國內(nèi)率先復(fù)現(xiàn)了Sora的成果,并通過Etna模型等創(chuàng)新技術(shù)取得了重大突破。
Etna模型采用了Diffusion Transformer處理視頻數(shù)據(jù),實現(xiàn)了15秒4K60幀的超高清晰度,同時具備了時空理解能力和深度語義理解能力。
從上圖可以看出,相較于市場上的現(xiàn)有模型,Etna在時長、高清晰度、豐富生動細(xì)節(jié)和強語義理解上,都保持著較大優(yōu)勢。
為什么七火山能成為國內(nèi)率先復(fù)現(xiàn)出Sora的公司?Sora的關(guān)鍵創(chuàng)新,是一個可以靈活地處理不同維度數(shù)據(jù)的Diffusion Transformer。時空壓縮器會把原始視頻轉(zhuǎn)映射到潛空間中,視覺Transformer(ViT)模型會對已經(jīng)被分詞的潛表征進行處理,并輸出去除噪聲后的潛表征。
一個與CLIP模型類似的系統(tǒng)根據(jù)用戶的指令(已經(jīng)通過大語言模型進行了增強)和潛視覺提示,引導(dǎo)擴散模型生成具有特定風(fēng)格或主題的視頻。經(jīng)過多次去噪處理之后,會得到生成視頻的潛表征,然后通過相應(yīng)的解碼器映射回像素空間。
在相關(guān)領(lǐng)域技術(shù)積累的基礎(chǔ)上,Etna模型迅速抓住了Sora的精髓,另外還引入了幾項創(chuàng)新。技術(shù)架構(gòu)創(chuàng)新主要是針對視頻的時空特性提出的挑戰(zhàn),如何從空間和時間上將視頻壓縮到潛空間,以實現(xiàn)高效去噪,如何將壓縮潛空間轉(zhuǎn)換為patches,并將其輸入到Transformer中,以及如何處理長距離的時空依賴性,并確保內(nèi)容的一致性。
為此,Etna模型在主干網(wǎng)絡(luò)上采用了Diffusion架構(gòu),同時在一個更大的數(shù)據(jù)集上實驗和適配與Sora相似的Diffusion+Transform架構(gòu)。融合了Diffusion模型和Transformer模型的優(yōu)勢,Etna形成了一種高效且先進的新型模型架構(gòu),提升了模型的生成效率,保證了生成內(nèi)容的高質(zhì)量和高一致性。
七火山公司不僅布局了AI多模態(tài)產(chǎn)品,還與小米、快手等合作伙伴展開戰(zhàn)略合作,共同探索短劇出海市場。
資本市場對七火山公司的發(fā)展充滿了期待,認(rèn)為其具備了潛在的成長空間和投資價值。AI視頻技術(shù)的興起將顛覆整個短視頻產(chǎn)業(yè)鏈,為用戶帶來全新的觀影體驗,也為產(chǎn)業(yè)鏈上下游企業(yè)帶來了更多的商機和發(fā)展空間。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。