家庭能源智聯(lián)自由 海辰儲(chǔ)能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o(jì)3:AI 推理能力的重大突破,得分高達(dá)87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團(tuán)外賣出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動(dòng)6000億GTV后,抖音計(jì)劃偷襲美團(tuán)大本營(yíng)AGI Open Network(AON):賦能每個(gè)人創(chuàng)建、部署和貨幣化AI Agent貸款利率史上最低了嗎?東融教你看懂歷年啥水平“客服來(lái)電”有詐?抖音客服上線“驗(yàn)證助手”助用戶識(shí)別詐騙OpenAI新模型GPT-5研發(fā)未達(dá)預(yù)期:成本高昂 效果不佳曝天馬打入果鏈:為蘋果HomePod供應(yīng)LCD屏 每塊屏僅10美元曝OPPO或首發(fā)新款天璣次旗艦芯片 兩大子品牌Q2發(fā)力諾基亞攜手阿聯(lián)酋運(yùn)營(yíng)商e&,展示全球首個(gè)固網(wǎng)游戲端到端網(wǎng)絡(luò)切片方案零下25℃制熱26℃!海爾水暖通黑科技亮相冰雪大世界三星沒(méi)放棄曲面屏開發(fā)!最新專利曝光暗示有望回歸三大運(yùn)營(yíng)商11月成績(jī)單:用戶數(shù)據(jù)增幅放緩打造下一個(gè)英偉達(dá),孫正義的2026芯片計(jì)劃曝光瞭望2025全球6G技術(shù)發(fā)展趨勢(shì)AI時(shí)代云安全新范式,暢捷通智能守護(hù)小微企業(yè)安全上云百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型 Baichuan4-Finance
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    媲美Suno、Udio!AI鐵了心,要砸音樂(lè)人的飯碗

    2024年05月10日 09:08:00   來(lái)源:​AIGC開放社區(qū)公眾號(hào)

      5月10日凌晨,著名語(yǔ)音生成式AI平臺(tái)ElevenLabs在社交平臺(tái)宣布,推出文本生成歌曲產(chǎn)品ElevenLabs Music。

      從其展示的效果來(lái)看,音樂(lè)的節(jié)奏感、和聲、樂(lè)器的搭配、情感表達(dá)、創(chuàng)意性、風(fēng)格的多樣性、高/低音,可媲美該領(lǐng)域的兩款頭部產(chǎn)品Suno和Udio。

      特別是人聲獨(dú)唱部分,清晰度、擬人化和樂(lè)器的融合度超過(guò)了那兩款產(chǎn)品。這是因?yàn)镋levenLabs就是靠語(yǔ)音克隆起家的,在研究人聲方面更專業(yè),并且積累了海量超29種語(yǔ)言的語(yǔ)音,為訓(xùn)練AI模型提供了極大幫助。

      本以為Sora的出現(xiàn)會(huì)改變影視、游戲領(lǐng)域的創(chuàng)作方式,沒(méi)想到最先被變革的卻是音樂(lè)領(lǐng)域,鐵了心要砸音樂(lè)人的飯碗。

      Suno、Udio、ElevenLabs Music產(chǎn)品對(duì)比

      ElevenLabs Music在社交平臺(tái)展示了通過(guò)文本生成的多首音樂(lè)。

      歌曲名:《傷透我的心》

      文本描述:平滑的當(dāng)代 R&B 音樂(lè),帶有微妙的電子元素,拍子為104BPM 的鼓機(jī)節(jié)拍,過(guò)濾的合成器,華麗的電鋼琴和高亢的弦樂(lè),營(yíng)造出親密的氛圍。

      歌曲名:《我的愛》

      文本描述:90年代搖滾風(fēng)格,滄桑的嗓音結(jié)合清晰的吉他,強(qiáng)勁的鼓點(diǎn)和突出的貝斯線,中等的120BPM 節(jié)奏,混合亢奮的情緒喚起懷舊和希望的感覺。

      下面在給大家聽兩首Suno和Udio生成的歌曲,來(lái)評(píng)價(jià)下這三家平臺(tái)各自的產(chǎn)品特點(diǎn)。

      Udio生成的是一首女聲搖滾風(fēng)格,關(guān)于愛情的歌曲。

      Suno生成的一首懷舊搖滾風(fēng)格,是關(guān)于描述區(qū)塊鏈、AI、數(shù)字金融的歌曲。

      這里可以明顯聽出來(lái),ElevenLabs Music的人聲更通透、清晰一些。

      如果沒(méi)有人提醒,相信多數(shù)人很難能聽的出來(lái)上面所有音樂(lè)是AI自動(dòng)生成的吧。這些產(chǎn)品可以幫助普通人實(shí)現(xiàn)當(dāng)“歌手”的夢(mèng)想,你只需要寫出詳細(xì)的歌曲文本描述,其他的交給AI即可。

      此外,對(duì)于那些需要?jiǎng)?chuàng)作靈感的專業(yè)音樂(lè)人來(lái)說(shuō)幫助也是巨大的,可以從AI生成的音樂(lè)中找出創(chuàng)作靈感。其實(shí)早期的80、90年代的歌壇就是互相借鑒來(lái)創(chuàng)作出不同的音樂(lè)作品。

      ElevenLabs介紹

      ElevenLabs是一家「AIGC開放社區(qū)」介紹多次的生成式AI語(yǔ)音平臺(tái),由前谷歌工程師Piotr Dąbkowski 和Palantir部署策略師Mateusz Staniszewski于2022年共同創(chuàng)立。曾在今年1月22日獲得8000萬(wàn)美元B輪融資。

      ElevenLabs的主打產(chǎn)品有語(yǔ)音克隆、文本轉(zhuǎn)語(yǔ)音、AI配音等,支持中文、英文、日文、韓文等29種主流語(yǔ)言。

      產(chǎn)品免費(fèi)體驗(yàn)地址:https://elevenlabs.io/text-to-speech

      語(yǔ)音克隆:用戶只需上傳一段1分鐘—30分鐘的樣板音頻,ElevenLabs就能生成幾乎和原聲一模一樣的音頻。例如,上傳一段西游記孫悟空的語(yǔ)音,用戶便可以提取其音頻用在別的地方。

      文本轉(zhuǎn)語(yǔ)音:用戶輸入文本,就能生成29種語(yǔ)言、120種不同類型的語(yǔ)音,并且在情感、節(jié)奏方面非常好機(jī)器感很少。

      AI配音:這是ElevenLabs最新推出專門針對(duì)電影、長(zhǎng)音頻領(lǐng)域的產(chǎn)品,可實(shí)現(xiàn)端到端的高保真音頻。

      此外,ElevenLabs還提供了一個(gè)語(yǔ)音庫(kù),用戶可以將自己生成的音頻或聲音與其他人分享來(lái)?yè)Q取報(bào)酬。未來(lái),通過(guò)Music生成的音樂(lè),也可以通過(guò)該平臺(tái)進(jìn)行分享。

      目前,ElevenLabs Music處于早期預(yù)覽版,全面開放測(cè)試后「AIGC開放社區(qū)」會(huì)第一時(shí)間告訴大家。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。