2月16日消息,據鞭牛士援引外電報道,OpenAI推出一種名為 Sora 的新的視頻生成模型。
這家人工智能公司表示,Sora 可以根據文本指令創(chuàng)建現實且富有想象力的場景。文本到視頻模型允許用戶創(chuàng)建長達一分鐘的逼真視頻——所有這些都基于他們編寫的提示。
根據 OpenAI 的介紹性博客文章,Sora 能夠創(chuàng)建具有多個角色、特定運動類型以及主題和背景的準確細節(jié)的復雜場景。該公司還指出,該模型可以理解物體在物理世界中如何存在,以及準確地解釋道具并生成引人注目的角色來表達充滿活力的情感。
該模型還可以基于靜止圖像生成視頻,以及填充現有視頻上缺失的幀或擴展它。
OpenAI 博客文章中包含的 Sora 生成的演示包括淘金熱期間加利福尼亞州的空中場景、一段看起來像是從東京火車內部拍攝的視頻等等。許多模型都有一些明顯的人工智能跡象——比如博物館視頻中可疑移動的地板。
OpenAI 表示,該模型可能難以準確模擬復雜場景的物理原理,但總體結果令人印象深刻。
幾年前,像 Midjourney 這樣的文本到圖像生成器處于模型將文字轉換為圖像的能力的最前沿。但最近,視頻開始以驚人的速度進步:Runway和 Pika 等公司展示了自己令人印象深刻的文本到視頻模型,而谷歌的 Lumiere 也被認為是 OpenAI 在這一領域的主要競爭對手之一。
與 Sora 類似,Lumiere 為用戶提供文本轉視頻工具,還允許他們從靜態(tài)圖像創(chuàng)建視頻。
OpenAI 還允許一些視覺藝術家、設計師和電影制作人獲取反饋。它指出,現有模型可能無法準確模擬復雜場景的物理原理,并且可能無法正確解釋某些因果實例。
本月早些時候,OpenAI 宣布將在其文本轉圖像工具 DALL-E 3 中添加水印,但指出它們可以輕松刪除。與其他人工智能產品一樣,OpenAI 將不得不應對虛假的人工智能真實視頻被誤認為真實的后果。
OpenAI 表示,它還在開發(fā)可以辨別視頻是否由 Sora 生成的工具。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。