拼多多解開了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資植物生長好幫手:廣明源金線蓮組培燈照亮生長每一步ROG純白系列DIY好物:簡約不失高雅,買它準(zhǔn)沒錯(cuò)!穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過DCI認(rèn)證并投入市場安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎電動自行車強(qiáng)制性“國標(biāo)”再修訂,綠源電動車以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對承壓的小家電市場,小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來激光電視主機(jī)僅有iPad大小2024年冷年空調(diào)市場總結(jié):規(guī)模下探,結(jié)構(gòu)降級,空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學(xué)能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀(jì)念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機(jī)型蓄勢待發(fā)云天勵飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革
  • 首頁 > 云計(jì)算頻道 > 大模型

    網(wǎng)易天音學(xué)步Suno

    2024年06月06日 11:36:07   來源:光子星球公眾號

      “少壯不努力,長大玩搖滾”。

      天才鼓手Buddy Rich以此強(qiáng)調(diào)大多限于五聲音階的搖滾樂鼓手與和弦編排豐富的傳統(tǒng)爵士鼓手的區(qū)別,隱喻專業(yè)音樂的素質(zhì)門檻。于當(dāng)下這個(gè)時(shí)代的音樂人來說,這句話應(yīng)該改成“少壯不努力,長大玩AI”。

      以Suno、Udio為代表的的新一代AI音樂平臺,借由大模型對人機(jī)交互方式的重構(gòu),將音樂生產(chǎn)的門檻拉低至自然語言的層面。

      “我們的目標(biāo)就是讓每個(gè)人都能將腦海中的音樂靈感 ,通過簡單易用的工具 , 轉(zhuǎn)化為實(shí)際的音樂作品”,Suno AI 首席執(zhí)行官和聯(lián)合創(chuàng)始人Mikey Shulman所言亦道出了其主要面向C端的產(chǎn)品策略,以最大幅度降低音樂生產(chǎn)門檻。

      這也讓針對音樂生產(chǎn)中“詞曲編錄混”等不同環(huán)節(jié)分別生成音樂,更符合音樂人的創(chuàng)作流程而非C端“玩具”的符號生成路線的產(chǎn)品黯然失色。更重要的是,國內(nèi)AI音樂賽道的玩家們大多都屬于此類,比如5月20日借著節(jié)日熱點(diǎn)正式向公眾開放AI音樂能力的網(wǎng)易云音樂。

      音頻生成對符號生成的擠壓之下,相對偏向?qū)I(yè)生產(chǎn)語境的產(chǎn)品特點(diǎn)客觀上導(dǎo)致國內(nèi)AI音樂產(chǎn)品被“束之高閣”。面對這一情況,原本在技術(shù)落地上便略顯踟躕的網(wǎng)易似乎更加舉棋不定——我們了解到,網(wǎng)易云音樂向公眾開放的音樂生成能力存在次數(shù)限制,而更深入使用需要注冊成為平臺音樂人。

      網(wǎng)易云音樂如此“瞻前顧后”,實(shí)際上也折射出國內(nèi)AI音樂既不愿成為“玩具”,又無法大舉進(jìn)入專業(yè)生產(chǎn)語境的落地困境。

      不做“玩具”

      與ChatGPT類似,被業(yè)內(nèi)視作音樂創(chuàng)作的“ChatGPT時(shí)刻”的SunoV3在用戶層面的成功源于其將技術(shù)產(chǎn)品化后“玩具化”——通過大模型“暴力”交互的特點(diǎn):用戶輸入文字,大模型輸出一首帶人聲的完整歌曲。

      截至目前,Suno累計(jì)用戶達(dá)1000萬,項(xiàng)目也趁勢于5月22日完成1.25億美元的B輪融資。

      有趣的是,恰是因?yàn)镾uno在用戶層面的成功,讓直接生成完整音樂的“Suno路線”,成為相對趨于保守的AI創(chuàng)投圈眼中的唯一正解。而過去基于MIDI的符號生成路線反而一定程度上陷入了一種“自證困境”——有創(chuàng)業(yè)者向我們抱怨:“如果你沒法證明自己能對標(biāo)Suno,投資人就不給錢了”。

      雖然背靠網(wǎng)易集團(tuán)沒有資金支持之虞,但網(wǎng)易云音樂旗下的AI編曲平臺網(wǎng)易天音同樣陷入了“自證困境”——光子星球在《丁磊的權(quán)杖,揮向音樂版權(quán)》中就有提到,網(wǎng)易天音一直在用戶層面的玩具與專業(yè)生產(chǎn)工具中搖擺,而本次向公眾開放能力似乎是其“玩具化”的嘗試。

      目前網(wǎng)易天音開放的3項(xiàng)工具分別是AI編曲、AI一鍵寫歌、AI作詞,其中編曲與作詞是早在2022年網(wǎng)易天音上線之時(shí)便已封裝成熟的能力,顯然重頭戲在于更適合音樂小白的寫歌。

      值得注意的是,網(wǎng)易天音的一鍵寫歌并非音頻直接生成,而是根據(jù)提示詞分別生成伴奏與人聲,再綜合渲染。伴奏方面基于網(wǎng)易云既有編曲庫的風(fēng)格生成,而人聲則來微軟小冰的X·studio中的AI歌手,無論是人聲還是伴奏編曲均支持用戶自行編輯。

      我們體驗(yàn)后發(fā)現(xiàn),用戶只需輸入數(shù)個(gè)關(guān)鍵詞或場景作為意象,即可串聯(lián)成完整曲目。就目前產(chǎn)品體驗(yàn)看,網(wǎng)易天音的成品曲目表現(xiàn)不盡如人意,在不采用大模型直接生成的情況下,詞曲之間存在一定的割裂,歌詞不甚通順,和弦生硬且斷句不得其法。

      相對出色的是編曲部分,AI編曲中有海量渲染風(fēng)格可供選擇,在門檻不高的前提下兼具了一定可玩性。我們可以通過對歌詞的修改以及調(diào)整渲染風(fēng)格、節(jié)奏、音調(diào)等,讓曲目變得“可堪一聽”。

      這意味著,網(wǎng)易天音雖然借Suno式一鍵成曲來推動產(chǎn)品的落地,看似成為了“玩具”,但本質(zhì)上還是走的過去的產(chǎn)品路徑,即音樂人的生產(chǎn)工具。

      回顧網(wǎng)易天音的產(chǎn)品歷程,其自2022年7月支持分軌導(dǎo)出MIDI后便再無較大的產(chǎn)品改動,直至去年6月與小冰合作推出AI人聲。只是受限于符號生成技術(shù)路線整體性不足的缺點(diǎn),人聲相關(guān)技術(shù)的引入對其落地并無太大幫助——好詞+好曲的組合不一定等于好音樂,正如上文提到的詞曲間的割裂。

      顯然,網(wǎng)易需要在一定場景下打磨詞曲“兼容”的能力。另一方面,在Suno的壓力下,符號生成路線產(chǎn)品的生存空間被不斷擠壓。一直在暗處“發(fā)育”的網(wǎng)易天音,也不得不披上“玩具”的外衣,以求打開公眾認(rèn)知。

      劍指版權(quán)

      “沒有一定樂理知識,小白也就只能拿來玩玩,拖來拖去消磨一下時(shí)間。”

      在一位獨(dú)立音樂人看來,網(wǎng)易天音在成曲之下的編曲、拍速、升降調(diào)等功能均面向?qū)I(yè)用戶,需要進(jìn)行一定程度的樂理學(xué)習(xí)方能順暢使用。即使其面向公眾開放,也難以掀起多大水花。

      與之相比,網(wǎng)易天音主頁下方高亮的“入駐網(wǎng)易音樂人”的圖標(biāo),才是網(wǎng)易希望講述的to P(專業(yè)生產(chǎn)者)故事。前文有述,成為平臺音樂人即可不受限制使用網(wǎng)易天音,這其實(shí)與該產(chǎn)品此前的準(zhǔn)入并無二致。但經(jīng)歷這次“全民玩音樂”的活動,無論是產(chǎn)品使用者還是平臺音樂人的數(shù)量無疑都將獲得不錯(cuò)的增長。

      據(jù)網(wǎng)易云音樂財(cái)報(bào),截至2023年底,平臺原創(chuàng)音樂人數(shù)量累計(jì)約68.4萬,共創(chuàng)作了約310萬首音樂曲目。此外,財(cái)報(bào)還提到AI推薦算法,進(jìn)一步提升了音樂生產(chǎn)與消費(fèi)環(huán)節(jié)的高效連接,2023年來自平臺推薦的音樂播放量占比持續(xù)增加,平臺算法推薦領(lǐng)先優(yōu)勢進(jìn)一步擴(kuò)大。

      由此不難看出網(wǎng)易云音樂為原創(chuàng)音樂社區(qū)設(shè)計(jì)的商業(yè)鏈路:AI分別自生產(chǎn)工具(網(wǎng)易天音)以及算法推薦把握消費(fèi)天平的兩端,網(wǎng)易天音降低音樂人的準(zhǔn)入并產(chǎn)出更多音樂,平臺算法則負(fù)責(zé)將這些音樂“喂”給用戶,從而給音樂人帶來收益。

      我們了解到,在網(wǎng)易天音這個(gè)生產(chǎn)端的變量普及前,網(wǎng)易云音樂之上活躍著大量“十八線音樂人”。

      有音樂愛好者長傳自己玩音樂的作品,而收入隨著平臺算法的演進(jìn)逐步自過去的月均幾百元提高至上千元(日播放量10000以上)。也有專業(yè)音樂人斥資數(shù)千元租賃錄音室錄歌,再數(shù)百元請工作室做歌曲后期渲染,卻因?yàn)槿鄙俨シ帕慷鴰缀躅w粒無收。

      前者隨著平臺AI算法的演進(jìn),音樂人的身份也自其愛好逐漸演變成一種副業(yè)形式;后者則可以通過AI工具大幅減少試錯(cuò)成本,從而能在音樂創(chuàng)作的道路上走得更長遠(yuǎn)。

      另一方面,AI原創(chuàng)音樂的生態(tài)版圖擴(kuò)大也意味著其在用戶總收聽時(shí)長中占比的擴(kuò)大,部分來自上游版權(quán)方的音源將被替代——切入生產(chǎn)環(huán)節(jié)從而擺脫“二道販子”身份,一直是流媒體平臺追逐的圣杯。況且,經(jīng)網(wǎng)易天音能力生產(chǎn)的歌曲均關(guān)聯(lián)其為聯(lián)合創(chuàng)作者,在AI音樂臻至成熟的未來,這或許是平臺借版權(quán)合理分潤的形式雛形。

      不過需要注意的是,在音樂分發(fā)形式未有明顯變革的情況下,平臺借AI發(fā)力生產(chǎn)端的上限似乎并不高。

      “現(xiàn)在的音樂市場雖然呈現(xiàn)出增量趨勢,但本質(zhì)上是生產(chǎn)過剩造成的‘假象’”,一家音樂工作室主理人告訴光子星球,“一首歌火不火全看資本助推(推薦)和概率”。

      言下之意是,當(dāng)下的音樂市場中,需求端并未出現(xiàn)明顯增長,而生產(chǎn)端卻在野蠻擴(kuò)張。正如為適應(yīng)短視頻BGM生產(chǎn)節(jié)奏而誕生的流水線作業(yè),一首歌的生產(chǎn)成本被簡化為人工、水電以及投流費(fèi)用。

      AI雖能進(jìn)一步降低生產(chǎn)門檻與成本,但在上述分發(fā)模式下,難免存在催生賽博垃圾的可能;蛟S在符號生成與音頻生成的路徑之爭下,這才是殊途同歸的終點(diǎn)。

      全靠“內(nèi)驅(qū)”?

      2023年4月7日,網(wǎng)易CEO丁磊在網(wǎng)易云音樂的個(gè)人賬戶上分享了由AI生成的網(wǎng)易嚴(yán)選7周年紀(jì)念歌曲《如期》。一個(gè)簡單的分享不僅為嚴(yán)選業(yè)務(wù)“帶貨”,更是將網(wǎng)易天音帶入大眾視野,同時(shí)也預(yù)告了與其小冰在AI人聲方面的合作。

      事實(shí)上,作為目前少數(shù)仍活躍在臺前的互聯(lián)網(wǎng)時(shí)代CEO,丁磊從不吝為自家產(chǎn)品站臺。這背后是丁磊在網(wǎng)易業(yè)務(wù)拓展中極強(qiáng)的“個(gè)人色彩”,他同時(shí)是音樂愛好者、游戲愛好者甚至養(yǎng)豬愛好者。另一方面,個(gè)人好惡似乎也在業(yè)績之外,為業(yè)務(wù)投入的考量樹立了一個(gè)新的維度。

      得益于此,網(wǎng)易在游戲、音樂兩大板塊的AI落地相對跑的更遠(yuǎn),也更堅(jiān)定。以音樂為例,在部分友商轉(zhuǎn)投音頻生成路線之時(shí),其對符號生成的堅(jiān)持并未被大模型與Suno的爆火所動搖。游戲業(yè)務(wù)更甚,畢竟這在愛好之上還疊了一個(gè)“養(yǎng)家糊口”的BUFF。

      不過,當(dāng)這樣的風(fēng)格在“上行下效”之下延續(xù)到網(wǎng)易AIGC探索的其他方面,故事也不再那么動聽。

      我們自一位接近網(wǎng)易人士處了解到,網(wǎng)易雖然在AIGC上的布局極廣,但其中有不少是源自部門領(lǐng)導(dǎo)的“喜好”的探索型業(yè)務(wù)。這些業(yè)務(wù)在公司的核心業(yè)務(wù)視野之外“悶頭發(fā)育”,可想而知的是,它們對內(nèi)需要和“親兒子”們爭資源,對外需要爭聲量,但現(xiàn)實(shí)是兩邊似乎都討不著好。

      “智能挖機(jī)和家用機(jī)器人這些都是一些領(lǐng)導(dǎo)的個(gè)人喜好,都是探索業(yè)務(wù)。”

      這客觀上導(dǎo)致了網(wǎng)易在除了游戲、音樂與教育以外的AIGC實(shí)踐相對散而不精。更重要的是,堅(jiān)持的另一面是踟躕,網(wǎng)易AIGC在內(nèi)部業(yè)務(wù)改造之外的商業(yè)化落地相對有些“慢熱”——去年6月便官宣與小冰合作,補(bǔ)齊生成完整歌曲最后一塊拼圖的網(wǎng)易云音樂,還是拖到Suno“兵臨城下”的時(shí)候才開始提速。

      有游戲養(yǎng)家,網(wǎng)易自然有慢熱的資本,但慢熱也意味著網(wǎng)易其他業(yè)務(wù)或難以脫離“小打小鬧”的范疇,養(yǎng)家還得看游戲。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎

    近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。