近日,阿里巴巴在人工智能領域再次取得突破,推出了一款名為AtomoVideo的高保真圖像到視頻生成框架。這一技術的問世,標志著基于文本到圖像生成技術的視頻生成領域取得了顯著的快速發(fā)展。
據(jù)官方介紹,AtomoVideo的核心在于其多粒度圖像注入技術,這一技術使得生成的視頻對于給定的圖像具有更高的保真度。這意味著,通過AtomoVideo生成的視頻,能夠更好地保留原始圖像的細節(jié)和特征,從而使得生成的視頻更加逼真。目前,阿里只發(fā)布了AtomoVideo的論文,代碼,試玩頁面等還未公布。
此外,AtomoVideo還得益于高質量的數(shù)據(jù)集和訓練策略,這使得其在保持卓越的時間性的同時,實現(xiàn)了更大的運動強度,一致性和穩(wěn)定性。這意味著,無論是在動作的連貫性,還是在動作的穩(wěn)定性上,AtomoVideo都能表現(xiàn)出色。
AtomoVideo的架構也具有很高的靈活性,它可以靈活地擴展到視頻幀預測任務,通過迭代生成實現(xiàn)長序列預測。這使得AtomoVideo在處理長序列的視頻預測任務時,也能夠保持良好的性能。
值得一提的是,由于適配器訓練的設計,AtomoVideo可以很好地與現(xiàn)有的個性化模型和可控模塊結合。這使得AtomoVideo在實際應用中,可以根據(jù)需要進行個性化定制,以滿足不同用戶的需求。
不過從AK大神發(fā)布的演示來看,AtomoVideo生成的視頻質量和sora相比差距較大,和SVD相比也有一些差距,希望后續(xù)會有更大的提升吧。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。