Luma v1.5版本在視頻生成領(lǐng)域取得了巨大進步,提升了視頻質(zhì)量、縮短了生成時間,帶來更快、更真、更清晰的視頻作品。
最近兩個月,國內(nèi)外的AI-generated Video應(yīng)用持續(xù)爆發(fā),中國的快手、字節(jié)、智譜AI、生數(shù)科技、愛詩科技,海外的谷歌、Luma、Runway,格局如八仙過海。
Open AI讓大模型風(fēng)暴席卷全球的最初那段時間里,快手并不是一個耀眼的角色。彼時,百度拿出文心一言,阿里拿出通義千問,騰訊拿出混元大模型,彼此追趕,研發(fā)與開放速度都很快。
2024年,Sora橫空出世,視頻大模型一夜之間成為AI大模型的塔尖之間。在Sora“高冷隱身”時,中國科技公司正在吭哧吭哧推動視頻大模型落地。
字節(jié)跳動團隊計劃于7月19日(本周五)首次大范圍公布其最新人工智能模型技術(shù)進展。此次公布的內(nèi)容涵蓋文生圖、類Sora新視頻等全新AI模型,特別在長視頻和高動態(tài)方向上將展示創(chuàng)新技術(shù),有望直接對標OpenAI的Sora文生視頻模型。
可靈初次發(fā)布的日期,距離Sora的驚艷出世,剛好過了半年,在這半年時間里,AI行業(yè)固然還在以一日千里的速度迭代,但視頻大模型的進展依然舉步維艱,除了作為「期貨」Sora還在吊著市場胃口,幾乎沒有能夠與之比肩的產(chǎn)品現(xiàn)身。
OpenAI 曾經(jīng)邀請專業(yè)視頻制作團隊對 Sora 進行了測試,其中來自于多倫多的 Shy Kids 團隊,利用 Sora 制作了一個氣球人主題的短片,把創(chuàng)意和 AI 技術(shù)進行了完美的結(jié)合,讓人印象深刻。
快手祭出文生視頻模型的的王炸,產(chǎn)品型創(chuàng)新能讓快手領(lǐng)先多少?
全球知名的玩具店“玩具反斗城”發(fā)布了全球首部利用 OpenAI 視頻生成大模型 Sora 制作的宣傳片《玩具反斗城的起源》。
6月13日,知名3D建模平臺Luma AI發(fā)布最新文生視頻模型Dream Machine,向所有用戶免費開放使用。
智譜 AI 正在研發(fā)對標 OpenAI Sora 的高質(zhì)量文生視頻模型,預(yù)計最快年內(nèi)發(fā)布。
Sora視頻生成器發(fā)布后不久,就被網(wǎng)友發(fā)現(xiàn)存在物理交互的bug,例如模型對物理世界的理解不足,導(dǎo)致小狗走路時前腿出現(xiàn)不自然的交錯問題。
4月27日上午,“2024中關(guān)村論壇-未來人工智能先鋒論壇”在北京正式舉辦,本次平行論壇由科學(xué)技術(shù)部、北京市人民政府主辦,旨在進一步探討“語言大模型”、“多模態(tài)大模型”、“具身智能”等新一代人工智能關(guān)鍵技術(shù)與應(yīng)用的創(chuàng)新。
Sora爆火后,掀起了全球競逐AI視頻生成的熱潮。近日,國內(nèi)一支AI生成的視頻短片引發(fā)關(guān)注。該視頻來自生數(shù)科技聯(lián)合清華大學(xué)最新發(fā)布的視頻大模型Vidu。
OpenAI 在二月份推出的視頻生成工具 Sora 引起了 AI 社區(qū)的廣泛關(guān)注。Sora 展示出的流暢、逼真的視頻似乎遠遠領(lǐng)先于競爭對手。然而,Sora 的首次亮相隱藏了一些重要細節(jié)。
4月27日,在2024中關(guān)村論壇-未來人工智能先鋒論壇上,清華大學(xué)聯(lián)合生數(shù)科技正式發(fā)布了,中國首個長時間、高一致性、高動態(tài)性視頻大模型——Vidu。
近日,Picsart AI Research等團隊聯(lián)合發(fā)布了一款名為StreamingT2V的AI視頻模型,該模型能夠生成長達1200幀、時長達2分鐘的視頻,這在技術(shù)上超越了之前備受關(guān)注的Sora模型。
自元宇宙后,總會有一波又一波高科技進展沖進人們的視野。
相比于Sora的大力出奇跡,多數(shù)國內(nèi)的文生視頻玩家走的不是這一條路。
近日,UT奧斯丁等機構(gòu)提出的StreamingT2V技術(shù)引發(fā)了廣泛關(guān)注,將AI視頻生成推向了新的高度。這項技術(shù)突破了以往視頻長度的限制,實現(xiàn)了生成高度一致且長度可擴展的視頻。
2024年開年,OpenAI再次用視頻生成模型Sora驚艷了世界。
OpenAI首席技術(shù)官米拉·穆拉蒂(Mira Murati)在接受采訪時透露,Sora文生視頻工具計劃在今年內(nèi)正式推向公眾。此外,OpenAI還計劃為Sora加入音頻生成功能,進一步豐富視頻的場景和情感表達。
Sora計劃在今年內(nèi)發(fā)布。據(jù)悉,Sora將推出一種全新的視頻生成技術(shù),能夠在短短幾分鐘內(nèi)生成一段20秒的720p視頻,而不需要花費幾個小時的時間。
Etna模型采用了Diffusion Transformer處理視頻數(shù)據(jù),實現(xiàn)了15秒4K60幀的超高清晰度,同時具備了時空理解能力和深度語義理解能力。
由顏水成和程明明領(lǐng)銜的研究團隊在Sora核心技術(shù)上進行了重要的升級,推出了Masked Diffusion Transformer V2。該模型在ImageNet benchmark上取得了驚人的成績,F(xiàn)ID score達到1.58,刷新了State-of-the-Art(SoTA)。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。