鴻蒙智行泊車代駕VPD正式開(kāi)啟全量推送!升級(jí)自動(dòng)泊車/接駕等多項(xiàng)功能華為官方翻新手機(jī)最高降價(jià)4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內(nèi)置自研W-Fi芯片李斌回應(yīng)螢火蟲外觀設(shè)計(jì):看過(guò)實(shí)車的人都喜歡這個(gè)設(shè)計(jì)林杰:未來(lái) A 級(jí)、A0 級(jí)、A00 級(jí)車型都將是領(lǐng)克純電的“主場(chǎng)”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設(shè)與智慧出行萬(wàn)象分區(qū)、絢彩XDR、量子點(diǎn)Pro 2025齊出手,TCL引領(lǐng)觀影體驗(yàn)新變革!QQ音樂(lè)年度聽(tīng)歌報(bào)告發(fā)布:誰(shuí)是你最喜歡的歌手?OpenAI正式發(fā)布o(jì)3 - 通往AGI的路上,已經(jīng)沒(méi)有了任何阻礙「送禮物」難撬動(dòng)社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學(xué)擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁(yè)技術(shù)報(bào)告出爐2024年結(jié)束,哪里是原創(chuàng)動(dòng)畫的應(yīng)許之地?深扒一個(gè)正被游戲行業(yè)「搶占」的流量帝國(guó)百思買重新進(jìn)軍跨境電商領(lǐng)域視頻生成大模型賽道,只是看上去擁擠GGII:預(yù)計(jì)2024年中國(guó)工業(yè)機(jī)器人全年銷量約30萬(wàn)臺(tái),同比下滑5%左右冰雪大世界盛大開(kāi)園,美的空調(diào)橫跨50℃打造“東北夏威夷”臺(tái)灣小土豆勇闖冰雪大世界,美的空調(diào)真暖快車成為最熱打卡點(diǎn)京東iPhone 16系列年底大放價(jià)!至高補(bǔ)貼1200元價(jià)格低過(guò)11.11新一季圓滿假期結(jié)伴大使出發(fā)在即 LG電子十年相伴助力溫暖傳遞
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    OpenAI正式上線Sora - 王者歸航

    2024年12月10日 09:04:55   來(lái)源:數(shù)字生命卡茲克公眾號(hào)

      今晚2點(diǎn),OpenAI Day3的直播。

      我們等了298天的Sora,終于,正式上線了。

      而且不僅僅是一個(gè)模型,而是一個(gè)非常完善且體驗(yàn)極佳的真正的產(chǎn)品。

      Sora背后接入的是一個(gè)新模型,Sora Turbo,推理成本肯定少了非常非常多,這也解釋了為啥OpenAI把Sora拖了這么久,就是因?yàn)槎路莸哪莻(gè)模型,推理起來(lái)太燒錢了,跑不動(dòng)。

      雖然是個(gè)新產(chǎn)品,但是會(huì)員體系是跟ChatGPT全面打通的。

      20刀的Plus比較慘,最多生成50個(gè)視頻,最多720P、5s,還有水印。

      尊貴的200刀的Pro會(huì)員就比較香了,最多快速生成500個(gè)視頻,還能無(wú)限慢速跑,1080P、20s,還有無(wú)水印。

      所以,沒(méi)辦法,我只能,當(dāng)場(chǎng)怒氪了200刀。。。

      于是,我也成了尊貴的200刀的Pro會(huì)員了,o1沒(méi)讓我充錢,但是Sora這波,我是真的逃不了了。。。

      真的都是宿命。

      2月16號(hào),OpenAI發(fā)布Sora,在全世界,掀起了新的浪潮。

      而那天,我也寫下了那篇傳播最廣的文章:

      OpenAI全新發(fā)布文生視頻模型Sora - 現(xiàn)實(shí),不存在了

      然后,就是死一般的沉寂。

      那個(gè)Sora,成了所有人心中,最遠(yuǎn)的夢(mèng)。宛如天上的星辰,美得不可方物,卻又遙不可及。

      有人說(shuō),5G只改變了何同學(xué)的生活,而Sora,也只改變了我的生活。

      雖是一句玩笑,但也卻只能是一聲嘆息。

      而今天,298天之后。

      在鐵王座上的王已經(jīng)換了無(wú)數(shù)次之后,在可靈、即夢(mèng)、海螺、vidu等等AI視頻模型已經(jīng)一統(tǒng)江湖之后。

      Sora回來(lái)了。

      它說(shuō):

      “重鑄OpenAI榮光,吾輩義不容辭。”

      這次,我用4句話總結(jié)這次Sora的完整特點(diǎn):

      極度完整的用戶體驗(yàn)、還不錯(cuò)的運(yùn)動(dòng)效果、超豐富的視頻修改與編輯、完美一致性的故事板。

      一個(gè)一個(gè)來(lái)說(shuō)。

      一. 極度完整的用戶體驗(yàn)

      我最開(kāi)始以為的Sora,是一個(gè)網(wǎng)頁(yè),就一個(gè)寫Prompt的輸入框,然后沒(méi)了。

      就跟很多AI視頻剛上線的時(shí)候一樣。

      結(jié)果,Sora這個(gè)產(chǎn)品,掏出來(lái)的完整度,還是超出了我的預(yù)期。

      在整體界面上,非常的Midjourney,有一種熟悉的感覺(jué)的即視感。

      最左邊的其實(shí)就是社區(qū)和你自己的生成出來(lái)的素材管理。

      有喜歡的、收藏的等等,不贅述了,都大差不差。

      而真正的操作區(qū),放在了底部,功能比我想象的要多很多。

      從左到右,分別是:

      上傳圖片或者視頻:Sora支持文生視頻、圖生視頻。所以可以傳圖。

      預(yù)設(shè)的風(fēng)格模板:

      當(dāng)然你也可以新增自己喜歡的風(fēng)格做成預(yù)設(shè)。

      比例:支持的比較少,只有16:9、1:1、9:16三種尺寸。

      分辨率:3種,480p到1080p,Plus會(huì)員只能生成720p的,pro會(huì)員才可以生成1080p。

      持續(xù)時(shí)長(zhǎng):4種,5s、10s、15s、20s,這里需要注意,720p的是可以生成20s的,但是如果你選1080p,那最多只能生成10s了。

      一次生成視頻個(gè)數(shù):1、2、4三種選擇,1080p最多1個(gè),720p最多2個(gè)、480p最多3個(gè)。

      右邊還有一個(gè)非常非常牛逼的故事板功能,這個(gè)我們放在第四趴細(xì)說(shuō)。

      非常牛逼,真的。

      在這個(gè)功能的完整度上,已經(jīng)比很多產(chǎn)品好了,但是,這不是最重要的,最可怕的完整度,是在生成視頻后。

      Remix(重新混合)、blend(混合)、Loop(循環(huán)),這些功能,是我全部第一次見(jiàn),也都是Sora的獨(dú)創(chuàng)功能,這一趴,我放在第三塊細(xì)說(shuō)。

      我們先來(lái)看看,Sora生成出來(lái)的效果。

      二.還不錯(cuò)的運(yùn)動(dòng)效果

      現(xiàn)在幾乎所有的AI視頻模型還在努力追趕真實(shí)世界的運(yùn)動(dòng)質(zhì)感,在讓人能走起來(lái)、跑起來(lái)、做一些復(fù)合型動(dòng)作。

      那Sora作為整個(gè)的鼻祖,其實(shí)在運(yùn)動(dòng)效果上,會(huì)好一些,但是并沒(méi)有好那么的超乎預(yù)期。

      我直接放我跑的真實(shí)case:

      80年代日本原宿時(shí)尚街。

      2. 一只小焦糖色的兔子在它的木屋里跳來(lái)跳去,看起來(lái)非常無(wú)害。

      3.一只擬人化的毛絨熊貓玩偶,穿著一件寬松的綠色針織開(kāi)衫、條紋上衣、黑色高腰短褲(或裙子)、條紋薄透連褲襪以及厚底黑色系帶靴子,頭頂一頂芥末黃色貝雷帽,戴著一副有色墨鏡。她站在一個(gè)工業(yè)風(fēng)的攝影棚里,背景是暗色混凝土墻,頭頂是燈光設(shè)備架,舞臺(tái)設(shè)備的細(xì)節(jié)若隱若現(xiàn)。這只毛絨熊貓開(kāi)始以自信而有節(jié)奏的動(dòng)作表演流暢的嘻哈舞。

      在運(yùn)動(dòng)質(zhì)量、物理規(guī)律、鏡頭語(yǔ)言上,會(huì)比大部分的AI視頻模型效果都要厲害。還有那個(gè)神級(jí)的審美。

      太喜歡了。

      當(dāng)然,不足也有很多,而且跟2月的時(shí)候,我覺(jué)得沒(méi)有太大的變化。

      就是肢體變形、物體的突然出現(xiàn)以及消失、錯(cuò)位等等,這些也還是會(huì)有不少。

      在一些復(fù)雜語(yǔ)義的理解上,也差點(diǎn)意思。

      比如,我給的Prompt是:“在那間破舊的出租公寓里,剛畢業(yè)的年輕人疲憊地脫下西裝外套,把它扔在椅背上。他走到窗邊,呆呆地望著城市的夜景。遠(yuǎn)處,霓虹燈閃爍。”

      你會(huì)發(fā)現(xiàn)完全沒(méi)有理解脫 衣服、扔衣服這事...一直漫無(wú)目的在屋子里走來(lái)走去。。。

      還會(huì)經(jīng)常有莫名其妙的切鏡,如果把時(shí)間拉到10s鐘,我個(gè)人覺(jué)得,切鏡的過(guò)于頻繁了。

      所以,整體來(lái)看,我覺(jué)得Sora如果對(duì)標(biāo)GPT進(jìn)度的話,那現(xiàn)在應(yīng)該是GPT2.5左右的水平。

      等到Sora的v2版本。

      那可能就真的能達(dá)到GPT3.5,那種全民可用的地步。

      產(chǎn)生巨大顛覆的效果了。

      三.超豐富的視頻修改與編輯

      如果我說(shuō),我希望在剛剛生成的的草地上,加個(gè)游泳池。

      我想,任何一個(gè)人都會(huì)用看煞筆的眼神來(lái)看我,不開(kāi)口罵我我覺(jué)得都是輕的。

      動(dòng)動(dòng)嘴,一句話改視頻,聽(tīng)起來(lái)像天方夜譚,對(duì)吧。

      但是Sora,做到了。

      這就是我們?cè)谥疤岬降,Remix(重混)功能。

      可以一句話,改掉視頻里面的素材。

      比如在他們的直播演示里,他們先生成了一段猛犸象在荒原奔跑的視頻。

      那如果你對(duì)這個(gè)猛犸象不滿意,想把他變成機(jī)械猛犸象。

      那就可以直接點(diǎn)remix,來(lái)一句話,改視頻。

      你可以修改Remix強(qiáng)度。

      來(lái)決定Remix值的大小。

      可以選擇溫和,于是,你就有了,機(jī)械猛犸象在荒原上奔跑。

      還有這個(gè)Blend混合功能。

      比如我們有兩段視頻。

      我想讓雪花先開(kāi)始放,然后無(wú)縫變成花朵的樣子,中間無(wú)縫斜街。

      Blend功能直接完美搞定。

      你還可以用Loop功能,做一段無(wú)限循環(huán)的海浪。

      甚至,OpenAI還給你開(kāi)了剪輯功能。。

      你可以,直接在Sora上面剪輯。

      只能說(shuō),這一波,產(chǎn)品功能的完成度,實(shí)在太高了。

      四. 完美一致性的故事板

      就是這個(gè)玩意。

      你可以通過(guò)不同的Prompt,生成幾乎完美一致性的分鏡,從而組成一段一分鐘的影片。

      其實(shí)用AI一鍵生成電影,是很多炒概念的公司,在打的點(diǎn)。

      因?yàn)殡娪,或者視頻,本質(zhì)上是由一個(gè)一個(gè)的鏡頭組成的。

      很多時(shí)候?yàn)榱嗽谇捌诰桶汛蟾诺漠嬅娑ê,就需要提前畫故事板?/p>

      比如《流浪地球2》上映的時(shí)候,就有媒體對(duì)當(dāng)時(shí)球2的故事板指導(dǎo)費(fèi)雪豪老師做過(guò)專訪,其中透露了一些故事板的設(shè)計(jì),就是長(zhǎng)這樣的。

      雖然是一幀一幀的,但是你也能看出來(lái),其中的動(dòng)態(tài)表達(dá),還有那種強(qiáng)到夸張的戲劇張力,更重要的是。

      每一幀之間的一致性。

      而這一點(diǎn),是每一個(gè)試圖去做故事板的AI產(chǎn)品,都逃不過(guò)的核心點(diǎn)。

      你前后鏡頭的人物、場(chǎng)景,如果都長(zhǎng)得不一樣,那還聊啥沉浸感,對(duì)吧。

      所以,過(guò)往的類似于LTX Studio的產(chǎn)品,我覺(jué)得失敗就失敗在這。因?yàn)槎际窍壬鷪D,然后圖生視頻,一致性,太難太難保持了。

      但是Sora這次,靠著自己的特性,把每一段的鏡頭的一致性,做到了完美。

      你可以直接在時(shí)間軸中,加分鏡幀,來(lái)引導(dǎo)每個(gè)畫面應(yīng)該怎么做。

      不僅能實(shí)現(xiàn)一個(gè)鏡頭里面的多動(dòng)作引導(dǎo),還能實(shí)現(xiàn)可控的分鏡切鏡。

      比如我寫的這一段。

      你可以隨意拖動(dòng)是時(shí)間軸上的分鏡,以便控制讓它從幾秒鐘開(kāi)始。

      然后,一段流暢的動(dòng)作視頻,就生成完畢了。

      而且不止是文字。

      你還可以輸入圖片,比如我上傳兩張圖片進(jìn)去。

      就可以完美的實(shí)現(xiàn)首尾幀的效果。

      寫在最后

      298天,說(shuō)長(zhǎng)不長(zhǎng),說(shuō)短不短。

      298天,也恍若一夢(mèng)。

      這298天里,我們見(jiàn)證了AI視頻領(lǐng)域的群雄并起。

      可靈首當(dāng)其沖劃破黑暗,即夢(mèng)用完美的人物演繹征服觀眾,海螺用極致的表情贏得掌聲,Vidu用完美的一致性獲得贊譽(yù),開(kāi)源世界里也有智譜和混元讓黎明升起。

      每一個(gè)都像是一顆璀璨的星星,照亮了那一片天空。

      但在這298天里,更看到了人性的投射。

      有人用AI還原逝去至親的音容笑貌,有人用它創(chuàng)作出天馬行空的奇思妙想,有人用它表達(dá)內(nèi)心最深處的情感。

      AI不僅是冰冷的工具,而成為了我們創(chuàng)造力的延伸。

      當(dāng)影像制作的門檻被徹底打破,當(dāng)每個(gè)人都能輕松創(chuàng)作出專業(yè)級(jí)的視頻。

      我覺(jué)得更值得思考的是:

      我們要用這份能力做些什么?是沉迷于虛擬的完美,還是用它來(lái)表達(dá)真實(shí)的情感?是制造更多的喧囂,還是傳遞更有價(jià)值的聲音?

      在這個(gè)即將影像即真相的時(shí)代,我們每個(gè)人都將面對(duì)這個(gè)選擇。

      而且,這亦不是終點(diǎn),而是另一個(gè)起點(diǎn)。

      因?yàn)樵贏I的世界里,永遠(yuǎn)沒(méi)有最后一個(gè)奇跡。

      只有,下一個(gè)奇跡。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。