OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號(hào)能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡(luò)體驗(yàn)電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強(qiáng)控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應(yīng),強(qiáng)者恒強(qiáng)?——《中國企業(yè)科創(chuàng)力研究報(bào)告(2024)》美團(tuán)年度報(bào)告竟然用上了AI和短?這下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術(shù)分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級(jí)自動(dòng)泊車/接駕等多項(xiàng)功能華為官方翻新手機(jī)最高降價(jià)4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內(nèi)置自研W-Fi芯片李斌回應(yīng)螢火蟲外觀設(shè)計(jì):看過實(shí)車的人都喜歡這個(gè)設(shè)計(jì)林杰:未來 A 級(jí)、A0 級(jí)、A00 級(jí)車型都將是領(lǐng)克純電的“主場”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設(shè)與智慧出行萬象分區(qū)、絢彩XDR、量子點(diǎn)Pro 2025齊出手,TCL引領(lǐng)觀影體驗(yàn)新變革!QQ音樂年度聽歌報(bào)告發(fā)布:誰是你最喜歡的歌手?OpenAI正式發(fā)布o(jì)3 - 通往AGI的路上,已經(jīng)沒有了任何阻礙「送禮物」難撬動(dòng)社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學(xué)擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁技術(shù)報(bào)告出爐2024年結(jié)束,哪里是原創(chuàng)動(dòng)畫的應(yīng)許之地?深扒一個(gè)正被游戲行業(yè)「搶占」的流量帝國
  • 首頁 > 云計(jì)算頻道 > 大模型

    網(wǎng)易天音學(xué)步Suno

    2024年06月06日 11:36:07   來源:光子星球公眾號(hào)

      “少壯不努力,長大玩搖滾”。

      天才鼓手Buddy Rich以此強(qiáng)調(diào)大多限于五聲音階的搖滾樂鼓手與和弦編排豐富的傳統(tǒng)爵士鼓手的區(qū)別,隱喻專業(yè)音樂的素質(zhì)門檻。于當(dāng)下這個(gè)時(shí)代的音樂人來說,這句話應(yīng)該改成“少壯不努力,長大玩AI”。

      以Suno、Udio為代表的的新一代AI音樂平臺(tái),借由大模型對(duì)人機(jī)交互方式的重構(gòu),將音樂生產(chǎn)的門檻拉低至自然語言的層面。

      “我們的目標(biāo)就是讓每個(gè)人都能將腦海中的音樂靈感 ,通過簡單易用的工具 , 轉(zhuǎn)化為實(shí)際的音樂作品”,Suno AI 首席執(zhí)行官和聯(lián)合創(chuàng)始人Mikey Shulman所言亦道出了其主要面向C端的產(chǎn)品策略,以最大幅度降低音樂生產(chǎn)門檻。

      這也讓針對(duì)音樂生產(chǎn)中“詞曲編錄混”等不同環(huán)節(jié)分別生成音樂,更符合音樂人的創(chuàng)作流程而非C端“玩具”的符號(hào)生成路線的產(chǎn)品黯然失色。更重要的是,國內(nèi)AI音樂賽道的玩家們大多都屬于此類,比如5月20日借著節(jié)日熱點(diǎn)正式向公眾開放AI音樂能力的網(wǎng)易云音樂。

      音頻生成對(duì)符號(hào)生成的擠壓之下,相對(duì)偏向?qū)I(yè)生產(chǎn)語境的產(chǎn)品特點(diǎn)客觀上導(dǎo)致國內(nèi)AI音樂產(chǎn)品被“束之高閣”。面對(duì)這一情況,原本在技術(shù)落地上便略顯踟躕的網(wǎng)易似乎更加舉棋不定——我們了解到,網(wǎng)易云音樂向公眾開放的音樂生成能力存在次數(shù)限制,而更深入使用需要注冊成為平臺(tái)音樂人。

      網(wǎng)易云音樂如此“瞻前顧后”,實(shí)際上也折射出國內(nèi)AI音樂既不愿成為“玩具”,又無法大舉進(jìn)入專業(yè)生產(chǎn)語境的落地困境。

      不做“玩具”

      與ChatGPT類似,被業(yè)內(nèi)視作音樂創(chuàng)作的“ChatGPT時(shí)刻”的SunoV3在用戶層面的成功源于其將技術(shù)產(chǎn)品化后“玩具化”——通過大模型“暴力”交互的特點(diǎn):用戶輸入文字,大模型輸出一首帶人聲的完整歌曲。

      截至目前,Suno累計(jì)用戶達(dá)1000萬,項(xiàng)目也趁勢于5月22日完成1.25億美元的B輪融資。

      有趣的是,恰是因?yàn)镾uno在用戶層面的成功,讓直接生成完整音樂的“Suno路線”,成為相對(duì)趨于保守的AI創(chuàng)投圈眼中的唯一正解。而過去基于MIDI的符號(hào)生成路線反而一定程度上陷入了一種“自證困境”——有創(chuàng)業(yè)者向我們抱怨:“如果你沒法證明自己能對(duì)標(biāo)Suno,投資人就不給錢了”。

      雖然背靠網(wǎng)易集團(tuán)沒有資金支持之虞,但網(wǎng)易云音樂旗下的AI編曲平臺(tái)網(wǎng)易天音同樣陷入了“自證困境”——光子星球在《丁磊的權(quán)杖,揮向音樂版權(quán)》中就有提到,網(wǎng)易天音一直在用戶層面的玩具與專業(yè)生產(chǎn)工具中搖擺,而本次向公眾開放能力似乎是其“玩具化”的嘗試。

      目前網(wǎng)易天音開放的3項(xiàng)工具分別是AI編曲、AI一鍵寫歌、AI作詞,其中編曲與作詞是早在2022年網(wǎng)易天音上線之時(shí)便已封裝成熟的能力,顯然重頭戲在于更適合音樂小白的寫歌。

      值得注意的是,網(wǎng)易天音的一鍵寫歌并非音頻直接生成,而是根據(jù)提示詞分別生成伴奏與人聲,再綜合渲染。伴奏方面基于網(wǎng)易云既有編曲庫的風(fēng)格生成,而人聲則來微軟小冰的X·studio中的AI歌手,無論是人聲還是伴奏編曲均支持用戶自行編輯。

      我們體驗(yàn)后發(fā)現(xiàn),用戶只需輸入數(shù)個(gè)關(guān)鍵詞或場景作為意象,即可串聯(lián)成完整曲目。就目前產(chǎn)品體驗(yàn)看,網(wǎng)易天音的成品曲目表現(xiàn)不盡如人意,在不采用大模型直接生成的情況下,詞曲之間存在一定的割裂,歌詞不甚通順,和弦生硬且斷句不得其法。

      相對(duì)出色的是編曲部分,AI編曲中有海量渲染風(fēng)格可供選擇,在門檻不高的前提下兼具了一定可玩性。我們可以通過對(duì)歌詞的修改以及調(diào)整渲染風(fēng)格、節(jié)奏、音調(diào)等,讓曲目變得“可堪一聽”。

      這意味著,網(wǎng)易天音雖然借Suno式一鍵成曲來推動(dòng)產(chǎn)品的落地,看似成為了“玩具”,但本質(zhì)上還是走的過去的產(chǎn)品路徑,即音樂人的生產(chǎn)工具。

      回顧網(wǎng)易天音的產(chǎn)品歷程,其自2022年7月支持分軌導(dǎo)出MIDI后便再無較大的產(chǎn)品改動(dòng),直至去年6月與小冰合作推出AI人聲。只是受限于符號(hào)生成技術(shù)路線整體性不足的缺點(diǎn),人聲相關(guān)技術(shù)的引入對(duì)其落地并無太大幫助——好詞+好曲的組合不一定等于好音樂,正如上文提到的詞曲間的割裂。

      顯然,網(wǎng)易需要在一定場景下打磨詞曲“兼容”的能力。另一方面,在Suno的壓力下,符號(hào)生成路線產(chǎn)品的生存空間被不斷擠壓。一直在暗處“發(fā)育”的網(wǎng)易天音,也不得不披上“玩具”的外衣,以求打開公眾認(rèn)知。

      劍指版權(quán)

      “沒有一定樂理知識(shí),小白也就只能拿來玩玩,拖來拖去消磨一下時(shí)間。”

      在一位獨(dú)立音樂人看來,網(wǎng)易天音在成曲之下的編曲、拍速、升降調(diào)等功能均面向?qū)I(yè)用戶,需要進(jìn)行一定程度的樂理學(xué)習(xí)方能順暢使用。即使其面向公眾開放,也難以掀起多大水花。

      與之相比,網(wǎng)易天音主頁下方高亮的“入駐網(wǎng)易音樂人”的圖標(biāo),才是網(wǎng)易希望講述的to P(專業(yè)生產(chǎn)者)故事。前文有述,成為平臺(tái)音樂人即可不受限制使用網(wǎng)易天音,這其實(shí)與該產(chǎn)品此前的準(zhǔn)入并無二致。但經(jīng)歷這次“全民玩音樂”的活動(dòng),無論是產(chǎn)品使用者還是平臺(tái)音樂人的數(shù)量無疑都將獲得不錯(cuò)的增長。

      據(jù)網(wǎng)易云音樂財(cái)報(bào),截至2023年底,平臺(tái)原創(chuàng)音樂人數(shù)量累計(jì)約68.4萬,共創(chuàng)作了約310萬首音樂曲目。此外,財(cái)報(bào)還提到AI推薦算法,進(jìn)一步提升了音樂生產(chǎn)與消費(fèi)環(huán)節(jié)的高效連接,2023年來自平臺(tái)推薦的音樂播放量占比持續(xù)增加,平臺(tái)算法推薦領(lǐng)先優(yōu)勢進(jìn)一步擴(kuò)大。

      由此不難看出網(wǎng)易云音樂為原創(chuàng)音樂社區(qū)設(shè)計(jì)的商業(yè)鏈路:AI分別自生產(chǎn)工具(網(wǎng)易天音)以及算法推薦把握消費(fèi)天平的兩端,網(wǎng)易天音降低音樂人的準(zhǔn)入并產(chǎn)出更多音樂,平臺(tái)算法則負(fù)責(zé)將這些音樂“喂”給用戶,從而給音樂人帶來收益。

      我們了解到,在網(wǎng)易天音這個(gè)生產(chǎn)端的變量普及前,網(wǎng)易云音樂之上活躍著大量“十八線音樂人”。

      有音樂愛好者長傳自己玩音樂的作品,而收入隨著平臺(tái)算法的演進(jìn)逐步自過去的月均幾百元提高至上千元(日播放量10000以上)。也有專業(yè)音樂人斥資數(shù)千元租賃錄音室錄歌,再數(shù)百元請(qǐng)工作室做歌曲后期渲染,卻因?yàn)槿鄙俨シ帕慷鴰缀躅w粒無收。

      前者隨著平臺(tái)AI算法的演進(jìn),音樂人的身份也自其愛好逐漸演變成一種副業(yè)形式;后者則可以通過AI工具大幅減少試錯(cuò)成本,從而能在音樂創(chuàng)作的道路上走得更長遠(yuǎn)。

      另一方面,AI原創(chuàng)音樂的生態(tài)版圖擴(kuò)大也意味著其在用戶總收聽時(shí)長中占比的擴(kuò)大,部分來自上游版權(quán)方的音源將被替代——切入生產(chǎn)環(huán)節(jié)從而擺脫“二道販子”身份,一直是流媒體平臺(tái)追逐的圣杯。況且,經(jīng)網(wǎng)易天音能力生產(chǎn)的歌曲均關(guān)聯(lián)其為聯(lián)合創(chuàng)作者,在AI音樂臻至成熟的未來,這或許是平臺(tái)借版權(quán)合理分潤的形式雛形。

      不過需要注意的是,在音樂分發(fā)形式未有明顯變革的情況下,平臺(tái)借AI發(fā)力生產(chǎn)端的上限似乎并不高。

      “現(xiàn)在的音樂市場雖然呈現(xiàn)出增量趨勢,但本質(zhì)上是生產(chǎn)過剩造成的‘假象’”,一家音樂工作室主理人告訴光子星球,“一首歌火不火全看資本助推(推薦)和概率”。

      言下之意是,當(dāng)下的音樂市場中,需求端并未出現(xiàn)明顯增長,而生產(chǎn)端卻在野蠻擴(kuò)張。正如為適應(yīng)短視頻BGM生產(chǎn)節(jié)奏而誕生的流水線作業(yè),一首歌的生產(chǎn)成本被簡化為人工、水電以及投流費(fèi)用。

      AI雖能進(jìn)一步降低生產(chǎn)門檻與成本,但在上述分發(fā)模式下,難免存在催生賽博垃圾的可能;蛟S在符號(hào)生成與音頻生成的路徑之爭下,這才是殊途同歸的終點(diǎn)。

      全靠“內(nèi)驅(qū)”?

      2023年4月7日,網(wǎng)易CEO丁磊在網(wǎng)易云音樂的個(gè)人賬戶上分享了由AI生成的網(wǎng)易嚴(yán)選7周年紀(jì)念歌曲《如期》。一個(gè)簡單的分享不僅為嚴(yán)選業(yè)務(wù)“帶貨”,更是將網(wǎng)易天音帶入大眾視野,同時(shí)也預(yù)告了與其小冰在AI人聲方面的合作。

      事實(shí)上,作為目前少數(shù)仍活躍在臺(tái)前的互聯(lián)網(wǎng)時(shí)代CEO,丁磊從不吝為自家產(chǎn)品站臺(tái)。這背后是丁磊在網(wǎng)易業(yè)務(wù)拓展中極強(qiáng)的“個(gè)人色彩”,他同時(shí)是音樂愛好者、游戲愛好者甚至養(yǎng)豬愛好者。另一方面,個(gè)人好惡似乎也在業(yè)績之外,為業(yè)務(wù)投入的考量樹立了一個(gè)新的維度。

      得益于此,網(wǎng)易在游戲、音樂兩大板塊的AI落地相對(duì)跑的更遠(yuǎn),也更堅(jiān)定。以音樂為例,在部分友商轉(zhuǎn)投音頻生成路線之時(shí),其對(duì)符號(hào)生成的堅(jiān)持并未被大模型與Suno的爆火所動(dòng)搖。游戲業(yè)務(wù)更甚,畢竟這在愛好之上還疊了一個(gè)“養(yǎng)家糊口”的BUFF。

      不過,當(dāng)這樣的風(fēng)格在“上行下效”之下延續(xù)到網(wǎng)易AIGC探索的其他方面,故事也不再那么動(dòng)聽。

      我們自一位接近網(wǎng)易人士處了解到,網(wǎng)易雖然在AIGC上的布局極廣,但其中有不少是源自部門領(lǐng)導(dǎo)的“喜好”的探索型業(yè)務(wù)。這些業(yè)務(wù)在公司的核心業(yè)務(wù)視野之外“悶頭發(fā)育”,可想而知的是,它們對(duì)內(nèi)需要和“親兒子”們爭資源,對(duì)外需要爭聲量,但現(xiàn)實(shí)是兩邊似乎都討不著好。

      “智能挖機(jī)和家用機(jī)器人這些都是一些領(lǐng)導(dǎo)的個(gè)人喜好,都是探索業(yè)務(wù)。”

      這客觀上導(dǎo)致了網(wǎng)易在除了游戲、音樂與教育以外的AIGC實(shí)踐相對(duì)散而不精。更重要的是,堅(jiān)持的另一面是踟躕,網(wǎng)易AIGC在內(nèi)部業(yè)務(wù)改造之外的商業(yè)化落地相對(duì)有些“慢熱”——去年6月便官宣與小冰合作,補(bǔ)齊生成完整歌曲最后一塊拼圖的網(wǎng)易云音樂,還是拖到Suno“兵臨城下”的時(shí)候才開始提速。

      有游戲養(yǎng)家,網(wǎng)易自然有慢熱的資本,但慢熱也意味著網(wǎng)易其他業(yè)務(wù)或難以脫離“小打小鬧”的范疇,養(yǎng)家還得看游戲。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。