今晚2點(diǎn),OpenAI Day3的直播。
我們等了298天的Sora,終于,正式上線了。
而且不僅僅是一個(gè)模型,而是一個(gè)非常完善且體驗(yàn)極佳的真正的產(chǎn)品。
Sora背后接入的是一個(gè)新模型,Sora Turbo,推理成本肯定少了非常非常多,這也解釋了為啥OpenAI把Sora拖了這么久,就是因?yàn)槎路莸哪莻(gè)模型,推理起來(lái)太燒錢了,跑不動(dòng)。
雖然是個(gè)新產(chǎn)品,但是會(huì)員體系是跟ChatGPT全面打通的。
20刀的Plus比較慘,最多生成50個(gè)視頻,最多720P、5s,還有水印。
尊貴的200刀的Pro會(huì)員就比較香了,最多快速生成500個(gè)視頻,還能無(wú)限慢速跑,1080P、20s,還有無(wú)水印。
所以,沒(méi)辦法,我只能,當(dāng)場(chǎng)怒氪了200刀。。。
于是,我也成了尊貴的200刀的Pro會(huì)員了,o1沒(méi)讓我充錢,但是Sora這波,我是真的逃不了了。。。
真的都是宿命。
2月16號(hào),OpenAI發(fā)布Sora,在全世界,掀起了新的浪潮。
而那天,我也寫下了那篇傳播最廣的文章:
OpenAI全新發(fā)布文生視頻模型Sora - 現(xiàn)實(shí),不存在了
然后,就是死一般的沉寂。
那個(gè)Sora,成了所有人心中,最遠(yuǎn)的夢(mèng)。宛如天上的星辰,美得不可方物,卻又遙不可及。
有人說(shuō),5G只改變了何同學(xué)的生活,而Sora,也只改變了我的生活。
雖是一句玩笑,但也卻只能是一聲嘆息。
而今天,298天之后。
在鐵王座上的王已經(jīng)換了無(wú)數(shù)次之后,在可靈、即夢(mèng)、海螺、vidu等等AI視頻模型已經(jīng)一統(tǒng)江湖之后。
Sora回來(lái)了。
它說(shuō):
“重鑄OpenAI榮光,吾輩義不容辭。”
這次,我用4句話總結(jié)這次Sora的完整特點(diǎn):
極度完整的用戶體驗(yàn)、還不錯(cuò)的運(yùn)動(dòng)效果、超豐富的視頻修改與編輯、完美一致性的故事板。
一個(gè)一個(gè)來(lái)說(shuō)。
一. 極度完整的用戶體驗(yàn)
我最開(kāi)始以為的Sora,是一個(gè)網(wǎng)頁(yè),就一個(gè)寫Prompt的輸入框,然后沒(méi)了。
就跟很多AI視頻剛上線的時(shí)候一樣。
結(jié)果,Sora這個(gè)產(chǎn)品,掏出來(lái)的完整度,還是超出了我的預(yù)期。
在整體界面上,非常的Midjourney,有一種熟悉的感覺(jué)的即視感。
最左邊的其實(shí)就是社區(qū)和你自己的生成出來(lái)的素材管理。
有喜歡的、收藏的等等,不贅述了,都大差不差。
而真正的操作區(qū),放在了底部,功能比我想象的要多很多。
從左到右,分別是:
上傳圖片或者視頻:Sora支持文生視頻、圖生視頻。所以可以傳圖。
預(yù)設(shè)的風(fēng)格模板:
當(dāng)然你也可以新增自己喜歡的風(fēng)格做成預(yù)設(shè)。
比例:支持的比較少,只有16:9、1:1、9:16三種尺寸。
分辨率:3種,480p到1080p,Plus會(huì)員只能生成720p的,pro會(huì)員才可以生成1080p。
持續(xù)時(shí)長(zhǎng):4種,5s、10s、15s、20s,這里需要注意,720p的是可以生成20s的,但是如果你選1080p,那最多只能生成10s了。
一次生成視頻個(gè)數(shù):1、2、4三種選擇,1080p最多1個(gè),720p最多2個(gè)、480p最多3個(gè)。
右邊還有一個(gè)非常非常牛逼的故事板功能,這個(gè)我們放在第四趴細(xì)說(shuō)。
非常牛逼,真的。
在這個(gè)功能的完整度上,已經(jīng)比很多產(chǎn)品好了,但是,這不是最重要的,最可怕的完整度,是在生成視頻后。
Remix(重新混合)、blend(混合)、Loop(循環(huán)),這些功能,是我全部第一次見(jiàn),也都是Sora的獨(dú)創(chuàng)功能,這一趴,我放在第三塊細(xì)說(shuō)。
我們先來(lái)看看,Sora生成出來(lái)的效果。
二.還不錯(cuò)的運(yùn)動(dòng)效果
現(xiàn)在幾乎所有的AI視頻模型還在努力追趕真實(shí)世界的運(yùn)動(dòng)質(zhì)感,在讓人能走起來(lái)、跑起來(lái)、做一些復(fù)合型動(dòng)作。
那Sora作為整個(gè)的鼻祖,其實(shí)在運(yùn)動(dòng)效果上,會(huì)好一些,但是并沒(méi)有好那么的超乎預(yù)期。
我直接放我跑的真實(shí)case:
80年代日本原宿時(shí)尚街。
2. 一只小焦糖色的兔子在它的木屋里跳來(lái)跳去,看起來(lái)非常無(wú)害。
3.一只擬人化的毛絨熊貓玩偶,穿著一件寬松的綠色針織開(kāi)衫、條紋上衣、黑色高腰短褲(或裙子)、條紋薄透連褲襪以及厚底黑色系帶靴子,頭頂一頂芥末黃色貝雷帽,戴著一副有色墨鏡。她站在一個(gè)工業(yè)風(fēng)的攝影棚里,背景是暗色混凝土墻,頭頂是燈光設(shè)備架,舞臺(tái)設(shè)備的細(xì)節(jié)若隱若現(xiàn)。這只毛絨熊貓開(kāi)始以自信而有節(jié)奏的動(dòng)作表演流暢的嘻哈舞。
在運(yùn)動(dòng)質(zhì)量、物理規(guī)律、鏡頭語(yǔ)言上,會(huì)比大部分的AI視頻模型效果都要厲害。還有那個(gè)神級(jí)的審美。
太喜歡了。
當(dāng)然,不足也有很多,而且跟2月的時(shí)候,我覺(jué)得沒(méi)有太大的變化。
就是肢體變形、物體的突然出現(xiàn)以及消失、錯(cuò)位等等,這些也還是會(huì)有不少。
在一些復(fù)雜語(yǔ)義的理解上,也差點(diǎn)意思。
比如,我給的Prompt是:“在那間破舊的出租公寓里,剛畢業(yè)的年輕人疲憊地脫下西裝外套,把它扔在椅背上。他走到窗邊,呆呆地望著城市的夜景。遠(yuǎn)處,霓虹燈閃爍。”
你會(huì)發(fā)現(xiàn)完全沒(méi)有理解脫 衣服、扔衣服這事...一直漫無(wú)目的在屋子里走來(lái)走去。。。
還會(huì)經(jīng)常有莫名其妙的切鏡,如果把時(shí)間拉到10s鐘,我個(gè)人覺(jué)得,切鏡的過(guò)于頻繁了。
所以,整體來(lái)看,我覺(jué)得Sora如果對(duì)標(biāo)GPT進(jìn)度的話,那現(xiàn)在應(yīng)該是GPT2.5左右的水平。
等到Sora的v2版本。
那可能就真的能達(dá)到GPT3.5,那種全民可用的地步。
產(chǎn)生巨大顛覆的效果了。
三.超豐富的視頻修改與編輯
如果我說(shuō),我希望在剛剛生成的的草地上,加個(gè)游泳池。
我想,任何一個(gè)人都會(huì)用看煞筆的眼神來(lái)看我,不開(kāi)口罵我我覺(jué)得都是輕的。
動(dòng)動(dòng)嘴,一句話改視頻,聽(tīng)起來(lái)像天方夜譚,對(duì)吧。
但是Sora,做到了。
這就是我們?cè)谥疤岬降,Remix(重混)功能。
可以一句話,改掉視頻里面的素材。
比如在他們的直播演示里,他們先生成了一段猛犸象在荒原奔跑的視頻。
那如果你對(duì)這個(gè)猛犸象不滿意,想把他變成機(jī)械猛犸象。
那就可以直接點(diǎn)remix,來(lái)一句話,改視頻。
你可以修改Remix強(qiáng)度。
來(lái)決定Remix值的大小。
可以選擇溫和,于是,你就有了,機(jī)械猛犸象在荒原上奔跑。
還有這個(gè)Blend混合功能。
比如我們有兩段視頻。
我想讓雪花先開(kāi)始放,然后無(wú)縫變成花朵的樣子,中間無(wú)縫斜街。
Blend功能直接完美搞定。
你還可以用Loop功能,做一段無(wú)限循環(huán)的海浪。
甚至,OpenAI還給你開(kāi)了剪輯功能。。
你可以,直接在Sora上面剪輯。
只能說(shuō),這一波,產(chǎn)品功能的完成度,實(shí)在太高了。
四. 完美一致性的故事板
就是這個(gè)玩意。
你可以通過(guò)不同的Prompt,生成幾乎完美一致性的分鏡,從而組成一段一分鐘的影片。
其實(shí)用AI一鍵生成電影,是很多炒概念的公司,在打的點(diǎn)。
因?yàn)殡娪,或者視頻,本質(zhì)上是由一個(gè)一個(gè)的鏡頭組成的。
很多時(shí)候?yàn)榱嗽谇捌诰桶汛蟾诺漠嬅娑ê,就需要提前畫故事板?/p>
比如《流浪地球2》上映的時(shí)候,就有媒體對(duì)當(dāng)時(shí)球2的故事板指導(dǎo)費(fèi)雪豪老師做過(guò)專訪,其中透露了一些故事板的設(shè)計(jì),就是長(zhǎng)這樣的。
雖然是一幀一幀的,但是你也能看出來(lái),其中的動(dòng)態(tài)表達(dá),還有那種強(qiáng)到夸張的戲劇張力,更重要的是。
每一幀之間的一致性。
而這一點(diǎn),是每一個(gè)試圖去做故事板的AI產(chǎn)品,都逃不過(guò)的核心點(diǎn)。
你前后鏡頭的人物、場(chǎng)景,如果都長(zhǎng)得不一樣,那還聊啥沉浸感,對(duì)吧。
所以,過(guò)往的類似于LTX Studio的產(chǎn)品,我覺(jué)得失敗就失敗在這。因?yàn)槎际窍壬鷪D,然后圖生視頻,一致性,太難太難保持了。
但是Sora這次,靠著自己的特性,把每一段的鏡頭的一致性,做到了完美。
你可以直接在時(shí)間軸中,加分鏡幀,來(lái)引導(dǎo)每個(gè)畫面應(yīng)該怎么做。
不僅能實(shí)現(xiàn)一個(gè)鏡頭里面的多動(dòng)作引導(dǎo),還能實(shí)現(xiàn)可控的分鏡切鏡。
比如我寫的這一段。
你可以隨意拖動(dòng)是時(shí)間軸上的分鏡,以便控制讓它從幾秒鐘開(kāi)始。
然后,一段流暢的動(dòng)作視頻,就生成完畢了。
而且不止是文字。
你還可以輸入圖片,比如我上傳兩張圖片進(jìn)去。
就可以完美的實(shí)現(xiàn)首尾幀的效果。
寫在最后
298天,說(shuō)長(zhǎng)不長(zhǎng),說(shuō)短不短。
298天,也恍若一夢(mèng)。
這298天里,我們見(jiàn)證了AI視頻領(lǐng)域的群雄并起。
可靈首當(dāng)其沖劃破黑暗,即夢(mèng)用完美的人物演繹征服觀眾,海螺用極致的表情贏得掌聲,Vidu用完美的一致性獲得贊譽(yù),開(kāi)源世界里也有智譜和混元讓黎明升起。
每一個(gè)都像是一顆璀璨的星星,照亮了那一片天空。
但在這298天里,更看到了人性的投射。
有人用AI還原逝去至親的音容笑貌,有人用它創(chuàng)作出天馬行空的奇思妙想,有人用它表達(dá)內(nèi)心最深處的情感。
AI不僅是冰冷的工具,而成為了我們創(chuàng)造力的延伸。
當(dāng)影像制作的門檻被徹底打破,當(dāng)每個(gè)人都能輕松創(chuàng)作出專業(yè)級(jí)的視頻。
我覺(jué)得更值得思考的是:
我們要用這份能力做些什么?是沉迷于虛擬的完美,還是用它來(lái)表達(dá)真實(shí)的情感?是制造更多的喧囂,還是傳遞更有價(jià)值的聲音?
在這個(gè)即將影像即真相的時(shí)代,我們每個(gè)人都將面對(duì)這個(gè)選擇。
而且,這亦不是終點(diǎn),而是另一個(gè)起點(diǎn)。
因?yàn)樵贏I的世界里,永遠(yuǎn)沒(méi)有最后一個(gè)奇跡。
只有,下一個(gè)奇跡。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。