穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過DCI認證并投入市場安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎電動自行車強制性“國標”再修訂,綠源電動車以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對承壓的小家電市場,小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來激光電視主機僅有iPad大小2024年冷年空調(diào)市場總結(jié):規(guī)模下探,結(jié)構(gòu)降級,空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機型蓄勢待發(fā)云天勵飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充FF發(fā)布第二品牌Faraday X:對標豐田 專注增程式混動車型黑神話悟空總收入超67億:銷量已超2000萬份通快成立激光業(yè)務(wù)區(qū)域中心(中國),強勢布局中國市場
  • 首頁 > 云計算頻道 > 大模型

    中國首個Sora級大模型Vidu:文本生成16秒,1080p高清視頻

    2024年04月28日 09:42:07   來源:AIGC開放社區(qū)公眾號

      4月27日,在2024中關(guān)村論壇-未來人工智能先鋒論壇上,清華大學聯(lián)合生數(shù)科技正式發(fā)布了,中國首個長時間、高一致性、高動態(tài)性視頻大模型——Vidu。

      據(jù)悉,Vidu采用了原創(chuàng)的Diffusion與Transformer融合的架構(gòu)U-ViT,支持文本生成長達16秒、分辨率高達1080P的高清視頻內(nèi)容。

      此外,Vidu不僅能夠模擬真實物理世界,還具備豐富想象力,具備多鏡頭生成、時空一致性高等技術(shù)特點。這也是繼Sora發(fā)布之后,全球率先取得重大突破的視頻大模型,性能全面對標國際頂尖水平,并加速功能迭代中。

      Vidu架構(gòu)簡單介紹

      生數(shù)科技的研發(fā)和原創(chuàng)能力非常強悍,已在全球頂級期刊arxiv上發(fā)布了超過15篇技術(shù)論文,這也是其能原創(chuàng)Vidu架構(gòu)的重要原因之一。

      研究人員表示,Vidu的快速突破源自于團隊在貝葉斯機器學習和多模態(tài)大模型的長期積累和多項原創(chuàng)性成果。

      其核心技術(shù)U-ViT架構(gòu)由團隊于2022年9月提出,早于Sora采用的DiT架構(gòu),是全球首個Diffusion與Transformer融合的架構(gòu)。

      2023年3月,生數(shù)科技開源了全球首個基于U-ViT融合架構(gòu)的多模態(tài)擴散模型UniDiffuser,并率先完成了U-ViT架構(gòu)的大規(guī)?蓴U展性驗證。

      基于對U-ViT架構(gòu)的深入理解以及長期積累的工程與數(shù)據(jù)經(jīng)驗,研究人員在短短兩個月里進一步突破了長視頻表示與處理的多項關(guān)鍵技術(shù),成功研發(fā)了Vidu視頻大模型,顯著提升視頻的連貫性和動態(tài)性。

      Vidu的發(fā)布不僅是U-ViT融合架構(gòu)在大規(guī)模視覺任務(wù)中的又一次成功驗證,也代表了生數(shù)科技在多模態(tài)原生大模型領(lǐng)域的持續(xù)創(chuàng)新能力和領(lǐng)先性。

      作為通用視覺模型,Vidu能夠支持生成更加多樣化、更長時長的視頻內(nèi)容,同時面向未來,靈活架構(gòu)將能夠兼容更廣泛的模態(tài),進一步拓展多模態(tài)通用能力的邊界。

      除了Vidu視頻大模型之外,生數(shù)科技還提供文生圖片、文本或圖片生成3D模型,已經(jīng)提供在線使用,有興趣的小伙伴可以去體驗一下。

      生數(shù)科技介紹

      北京生數(shù)科技有限公司(簡稱“生數(shù)科技”)成立于2023年3月,核心團隊成員來自清華大學人工智能研究院,此外 匯集了來自阿里、騰訊、字節(jié)等知名科技公司的頂尖人才,是全球范圍內(nèi)領(lǐng)先的深度生成式算法研究團隊,擁有擴散概率模型底層創(chuàng)新研發(fā)能力。

      生數(shù)科技致力打造世界領(lǐng)先的多模態(tài)大模型,融合文本、圖像、視頻、3D等多模態(tài)信息,探索生成式AI在藝術(shù)設(shè)計、游戲制作、影視后期、內(nèi)容社交等場景的商業(yè)賦能,通過AI提升人類的創(chuàng)造力和生產(chǎn)力。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。