7月11日,2023中國新媒體技術(shù)展在湖南國際會展中心舉行。本屆技術(shù)展以“智慧促深融”為主題,重點(diǎn)聚焦人工智能新技術(shù)新應(yīng)用、智慧媒體服務(wù)社會治理新場景等,呈現(xiàn)新技術(shù)賦能融合發(fā)展新生態(tài)。
會上,騰訊多媒體實(shí)驗(yàn)室展出了自研AI通用作曲框架XMusic,基于AIGC技術(shù),用戶只需上傳視頻、圖片、文字、標(biāo)簽、哼唱等任意內(nèi)容,即可生成情緒、曲風(fēng)、節(jié)奏可控的高質(zhì)量音樂,能夠大幅降低音樂創(chuàng)作的門檻。該產(chǎn)品前幾日首度亮相2023年世界人工智能大會,并被評為“鎮(zhèn)館之寶”,引發(fā)廣泛關(guān)注。
隨時隨地實(shí)現(xiàn)AI輔助創(chuàng)作,打造專屬“行走的音樂庫”
在日常生活中,用戶對使用音樂有著多種多樣的需求。比如在視頻剪輯時,需要應(yīng)用多樣的配樂來讓畫面更加生動,但音樂搜索一般只能用歌曲名字、歌手名字等指向性強(qiáng)的信息來搜索,需要耗費(fèi)大量的時間精力;亦或在商超、會場等場所布置時,傳統(tǒng)的環(huán)境音樂選擇容易受到版權(quán)限制,很難獲得多樣且合法的音樂素材。
面對這些難題,騰訊多媒體實(shí)驗(yàn)室自研AI通用作曲框架XMusic可以隨時隨地利用AI輔助實(shí)現(xiàn)音樂創(chuàng)作,打造個人專屬的“行走的音樂庫”。一張圖片、一段文字、一個視頻,甚至是一段哼唱,XMusic都能夠?qū)?yīng)生成出樂曲優(yōu)美連貫、旋律起伏明顯、節(jié)奏強(qiáng)弱交替的高質(zhì)量音樂。比如輸入“逗趣橫生,讓人捧腹大笑”的描述,XMusic就會生成一段節(jié)奏俏皮、旋律歡快的音樂。
對于視頻創(chuàng)作者而言,XMusic無疑是解決配樂難題的一大利器。除此之外,針對互動娛樂、輔助創(chuàng)作、音樂教育、互動娛樂、音樂治療等諸多場景,XMusic也有著很高的實(shí)用價值。
以場景音樂生成為例,XMusic的商用級音樂生成能力可以有效解決線下展廳、體驗(yàn)展、餐廳商超等場景中的環(huán)境音樂版權(quán)問題,為展廳提供多樣化的公播音樂,并在體驗(yàn)展中融入多種智能音樂方案,提升展廳的科技感和體驗(yàn)感。
此外,XMusic也可以發(fā)揮重要的教學(xué)輔助能力,推進(jìn)線上音樂教育的發(fā)展。比如在智慧音樂課堂中,教師可以用XMusic生成多樣的節(jié)拍、節(jié)奏、音高練習(xí)曲目,結(jié)合實(shí)際教學(xué)場景,發(fā)揮AI生成音樂的教學(xué)輔助能力,為學(xué)生在演奏、練耳等多種場景中提供個性化的指導(dǎo)和訓(xùn)練,幫助學(xué)生更快地提升音樂技能。
全面AIGC能力矩陣支撐,實(shí)現(xiàn)音樂高效精準(zhǔn)創(chuàng)作
作為本次技術(shù)展中的亮點(diǎn)之一,XMusic背后的騰訊多媒體實(shí)驗(yàn)室也受到了廣泛關(guān)注,一位熱愛音樂的科學(xué)家,帶領(lǐng)一群同樣熱愛音樂的工程師們從零到一落地了XMusic項(xiàng)目。2019年,騰訊多媒體實(shí)驗(yàn)室負(fù)責(zé)人、騰訊杰出科學(xué)家、IEEE Fellow 劉杉博士帶領(lǐng)實(shí)驗(yàn)室開展“基于多模態(tài)融合的智能內(nèi)容生產(chǎn)”相關(guān)技術(shù)能力研發(fā)并逐步完善AIGC能力矩陣。
騰訊多媒體實(shí)驗(yàn)室自研AI通用作曲框架XMusic,是基于自研的多模態(tài)和序列建模技術(shù),可以將提示詞內(nèi)容解析至符號音樂要素空間,并以此為控制條件引導(dǎo)模型生成豐富、精準(zhǔn)、動聽的音樂,達(dá)到商用級的音樂生成能力要求。
劉杉博士表示,人工智能技術(shù)的飛速發(fā)展對多媒體和相關(guān)領(lǐng)域產(chǎn)生深遠(yuǎn)影響。“騰訊(多媒體實(shí)驗(yàn)室)將繼續(xù)推動人工智能和多媒體及相關(guān)領(lǐng)域的國際和國家標(biāo)準(zhǔn)制定,打造音視頻、互動沉浸和智能媒體核心能力矩陣,通過騰訊云、騰訊視頻、騰訊游戲等業(yè)務(wù)平臺服務(wù)全球用戶、助力各行業(yè)發(fā)展并踐行科技向善。”
騰訊多媒體實(shí)驗(yàn)室還在展區(qū)展出前沿技術(shù)方面的三個項(xiàng)目:“全景'云'游東北虎豹國家公園”通過自研技術(shù)智能影像處理和自研VR360解決方案供所有人在“云端”走進(jìn)這片山林秘境;“虛實(shí)融合技術(shù)”產(chǎn)品,可將傳統(tǒng)虛擬制片的成本與難度大幅降低,無需傳感器,只通過一臺相機(jī)或手機(jī),就可將自己植入到虛擬世界中;“騰訊水墨畫”產(chǎn)品融合了視覺、音樂、文字等多種模態(tài),結(jié)合山水畫創(chuàng)作、智能作詩、音樂生成等多種技術(shù)能力,形成了多模態(tài)融合且能互動娛樂的完整技術(shù)方案。
騰訊多媒體實(shí)驗(yàn)室專注于多媒體和相關(guān)領(lǐng)域的前沿技術(shù)探索、產(chǎn)品研發(fā)和應(yīng)用落地,其行業(yè)領(lǐng)先的視頻圖片壓縮和處理引擎、沉浸式VR系統(tǒng)和智能媒體能力矩陣,通過騰訊云、騰訊視頻、騰訊游戲等業(yè)務(wù)平臺服務(wù)全球海量用戶并助力傳媒、文化、旅游等行業(yè)的發(fā)展。同時代表騰訊參與多個國際及國家標(biāo)準(zhǔn)制定,數(shù)十人次擔(dān)任聯(lián)合主席、主編等核心職務(wù),數(shù)百項(xiàng)技術(shù)提案被國際標(biāo)準(zhǔn)采納,榮獲工程艾美獎、技術(shù)盧米埃獎、ISO/IEC杰出貢獻(xiàn)獎等,享有國際盛譽(yù)。
未來,騰訊多媒體實(shí)驗(yàn)室將以創(chuàng)新的視角和前瞻的思維,不斷探索多媒體技術(shù)與AIGC能力的融合,拓展多領(lǐng)域的應(yīng)用場景,為用戶提供更加智能、便捷和豐富的多媒體體驗(yàn)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。