" />
“客服來電”有詐?抖音客服上線“驗證助手”助用戶識別詐騙OpenAI新模型GPT-5研發(fā)未達(dá)預(yù)期:成本高昂 效果不佳曝天馬打入果鏈:為蘋果HomePod供應(yīng)LCD屏 每塊屏僅10美元曝OPPO或首發(fā)新款天璣次旗艦芯片 兩大子品牌Q2發(fā)力諾基亞攜手阿聯(lián)酋運營商e&,展示全球首個固網(wǎng)游戲端到端網(wǎng)絡(luò)切片方案零下25℃制熱26℃!海爾水暖通黑科技亮相冰雪大世界三星沒放棄曲面屏開發(fā)!最新專利曝光暗示有望回歸三大運營商11月成績單:用戶數(shù)據(jù)增幅放緩打造下一個英偉達(dá),孫正義的2026芯片計劃曝光瞭望2025全球6G技術(shù)發(fā)展趨勢AI時代云安全新范式,暢捷通智能守護小微企業(yè)安全上云百川智能發(fā)布全鏈路領(lǐng)域增強金融大模型 Baichuan4-Finance年末家電消費觀察:品質(zhì)生活類產(chǎn)品熱賣,將持續(xù)迎來剛需式普及?GPT-5研發(fā)受阻:OpenAI 新一代模型難見突破性進展新一代語言模型ModernBERT發(fā)布,RAG等任務(wù)處理速度快四倍、成本低新研究顯示:Anthropic 的 Claude AI 在合作能力上領(lǐng)先于 OpenAI 和谷歌模型谷歌向投資者保證人工智能本月將迎來“驚人”表現(xiàn)多模態(tài)大模型引爆應(yīng)用場景 階躍星辰完成數(shù)億美元融資星動紀(jì)元發(fā)布端到端原生機器人大模型ERA-42 實現(xiàn)機器人復(fù)雜場景操作免費模式強攻下,快手、抖音用“短劇VIP”反擊?
  • 首頁 > 云計算頻道 > 大模型

    大佬拆解Sora工作原理 看完你就知道Sora為什么這么牛了

    2024年02月21日 12:14:56   來源:站長之家

      Sora是一款獨特的視頻生成工具,其工作原理深入淺出,值得我們深入了解。something new/old創(chuàng)始人brett goldstein在X上給大家拆解了Sora工作原理,通俗易懂。

      Sora的工作原理結(jié)合了擴散模型和Transformer架構(gòu)。擴散模型從噪聲開始,逐漸精細(xì)化到所需的視頻。而Transformer架構(gòu)則負(fù)責(zé)處理連續(xù)的視頻幀,確保視頻中的動作流暢自然。

      Sora的獨特之處在于其處理視頻生成的方法。它不是直接將文本轉(zhuǎn)換為視頻幀,而是依賴于所謂的“空間時間補丁”。這種方法不直接將文本轉(zhuǎn)換為視頻幀,而是處理空間(發(fā)生的事情)和時間(何時發(fā)生)的快照。這可以看作是微觀視頻拼圖的每一小塊。

      時空立方體:

      通過這種方式,Sora將視頻視為一個包含空間和時間維度的巨大立方體,然后再將其切割成更小的立方體,每個立方體代表空間和時間的片段。

      剖析描述并確定了核心要素:

      • 物體(盛開的花朵、陽光普照的窗臺)

      • 行動(隨著時間的推移而增長)

      • 位置(郊區(qū)環(huán)境)

      • 甚至藝術(shù)風(fēng)格(定格動畫美學(xué))

      為了能夠?qū)⑦@些補丁有意義地組合成一個連貫的視頻,Sora利用了其內(nèi)部的知識圖譜。這些知識圖譜包含了關(guān)于物理世界、對象如何相互作用,甚至包括不同藝術(shù)風(fēng)格的信息。借助這些知識,Sora能夠理解例如一朵花如何逐漸開放、如何與陽光互動以及如何保持停動畫風(fēng)格等復(fù)雜過程。

      在視頻生成的下一階段,擴散模型開始對每個嘈雜、抽象的補丁進行處理,逐漸精細(xì)化,直至最終呈現(xiàn)出清晰的圖像。而Transformer架構(gòu)則負(fù)責(zé)分析時間跨度上補丁之間的關(guān)系,確保視頻中的動作流暢自然,停動畫風(fēng)格在整個視頻序列中保持一致。

      盡管Sora能夠執(zhí)行各種與視頻相關(guān)的任務(wù),并展現(xiàn)出驚人的視頻生成能力,但仍有一些挑戰(zhàn)需要克服。例如,它在模擬一些基礎(chǔ)物理互動的精確性方面還有待提高,有時會產(chǎn)生不自然的效果,如人物的手勢看起來不夠真實。盡管如此,Sora在視頻生成技術(shù)方面展示了巨大的潛力,為未來的人工智能應(yīng)用開辟了新的可能性。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。