隨著人工智能、云計(jì)算、5G等新技術(shù)的成熟應(yīng)用,推動(dòng)了全球智能語(yǔ)音產(chǎn)業(yè)進(jìn)一步升級(jí)。而多語(yǔ)種語(yǔ)言互通、復(fù)雜場(chǎng)景交互的實(shí)現(xiàn),也給智能語(yǔ)音市場(chǎng)發(fā)展注入新動(dòng)能。據(jù)中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟《2020-2021中國(guó)智能語(yǔ)音產(chǎn)業(yè)發(fā)展白皮書》數(shù)據(jù)顯示,2020年全球智能語(yǔ)音產(chǎn)業(yè)規(guī)模約為203億美元,預(yù)計(jì)2021年產(chǎn)業(yè)規(guī)模將超過(guò)250億美元。
其中,歐美等成熟的海外市場(chǎng)具有優(yōu)質(zhì)的消費(fèi)群體和良好的用戶認(rèn)知,印度、東南亞等新興市場(chǎng)則存在蓬勃的市場(chǎng)潛力。處在這樣的經(jīng)濟(jì)大環(huán)境和市場(chǎng)整體趨勢(shì)下,越來(lái)越多的國(guó)內(nèi)企業(yè)瞄準(zhǔn)海外市場(chǎng),開(kāi)始“走出去”戰(zhàn)略。
多語(yǔ)種數(shù)據(jù)稀缺 語(yǔ)音合成難度大
對(duì)于主打AI語(yǔ)音產(chǎn)品的企業(yè)來(lái)說(shuō),在競(jìng)爭(zhēng)激烈的出海賽道中,不僅要面對(duì)不同的市場(chǎng)環(huán)境、人文特征、技術(shù)安全等一系列挑戰(zhàn),更需要克服錯(cuò)綜復(fù)雜的語(yǔ)言問(wèn)題,實(shí)現(xiàn)與當(dāng)?shù)赜脩?ldquo;無(wú)障礙溝通”。因此,解決智能語(yǔ)音產(chǎn)品的“說(shuō)話”問(wèn)題,是快速實(shí)現(xiàn)本地適配,打開(kāi)海外市場(chǎng)的首要條件。
從技術(shù)層面來(lái)看,多語(yǔ)種語(yǔ)音合成的實(shí)現(xiàn),需要根據(jù)語(yǔ)言積累構(gòu)建語(yǔ)種系統(tǒng)。而不同語(yǔ)言之間差異很大,所以需要根據(jù)不同的語(yǔ)言特性單獨(dú)建模。這就需要大量不同語(yǔ)種的數(shù)據(jù)做訓(xùn)練支撐。
據(jù)了解,目前世界上共有7000多種語(yǔ)言,其中使用人數(shù)超過(guò)5000萬(wàn)的語(yǔ)言僅有10余種。眾多語(yǔ)言中,使用人數(shù)少的小語(yǔ)種采集更加困難。本地口音,小語(yǔ)種訓(xùn)練數(shù)據(jù)匱乏,高昂的制作成本,給語(yǔ)種系統(tǒng)的構(gòu)建帶來(lái)不小的困難。
高質(zhì)量多語(yǔ)種數(shù)據(jù)集 助力企業(yè)出海
標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)領(lǐng)域多年,擁有專業(yè)的數(shù)據(jù)處理團(tuán)隊(duì)和強(qiáng)大的數(shù)據(jù)采集、處理能力,在數(shù)據(jù)采集和標(biāo)注方面具備豐富的實(shí)踐經(jīng)驗(yàn)。
面對(duì)多語(yǔ)種訓(xùn)練語(yǔ)料稀缺的難題,標(biāo)貝科技基于自有高規(guī)格錄音棚、全球優(yōu)質(zhì)聲優(yōu)資源,推出系列多語(yǔ)種合成語(yǔ)音數(shù)據(jù)庫(kù),覆蓋美語(yǔ)、英語(yǔ)、葡語(yǔ)、印尼語(yǔ)、巴葡語(yǔ)、西語(yǔ)、法語(yǔ)、德語(yǔ)、俄語(yǔ)、意大利語(yǔ)、西班牙語(yǔ)、韓語(yǔ)、日語(yǔ)等多語(yǔ)種語(yǔ)言,并完成對(duì)數(shù)據(jù)庫(kù)的音標(biāo)、重音標(biāo)注、韻律標(biāo)注,供算法優(yōu)化直接使用,助力國(guó)內(nèi)智能語(yǔ)音產(chǎn)品化解語(yǔ)言挑戰(zhàn),順利出海。
部分?jǐn)?shù)據(jù)庫(kù)展示如下:
1、美語(yǔ)女聲合成庫(kù)
語(yǔ)種:美式英語(yǔ)
采集環(huán)境:專業(yè)錄音棚,信噪比不低于35dB
數(shù)據(jù)時(shí)長(zhǎng):10.27小時(shí)
錄音語(yǔ)料:日常朗讀
采樣格式:無(wú)壓縮PCM WAV格式,采樣率為48KHz 16bit
標(biāo)注內(nèi)容:音字標(biāo)注、韻律標(biāo)注
適用領(lǐng)域:智能客服、新聞播報(bào)、語(yǔ)音導(dǎo)航等領(lǐng)域
2、英語(yǔ)男聲合成庫(kù)
語(yǔ)種:英式英語(yǔ)
采集環(huán)境:專業(yè)錄音棚,信噪比不低于35dB
數(shù)據(jù)時(shí)長(zhǎng):30小時(shí)
錄音語(yǔ)料:英文小說(shuō)
采樣格式:無(wú)壓縮PCM WAV格式,采樣率為48KHz 16bit
標(biāo)注內(nèi)容:音字標(biāo)注、韻律標(biāo)注
適用領(lǐng)域:有聲閱讀、智能客服、產(chǎn)品解說(shuō)等領(lǐng)域
3、德語(yǔ)男聲合成庫(kù)
語(yǔ)種:德語(yǔ)
采集環(huán)境:專業(yè)錄音棚,信噪比不低于35dB
數(shù)據(jù)時(shí)長(zhǎng):10小時(shí)
錄音語(yǔ)料:日常朗讀
采樣格式:無(wú)壓縮PCM WAV格式,采樣率為48KHz 16bit
標(biāo)注內(nèi)容:音字標(biāo)注、韻律標(biāo)注
適用領(lǐng)域:智能客服、新聞播報(bào)、語(yǔ)音助手等領(lǐng)域
4、巴葡青年男聲多風(fēng)格合成庫(kù)
語(yǔ)種:巴西葡萄牙語(yǔ)
采集環(huán)境:專業(yè)錄音棚,信噪比不低于35dB
數(shù)據(jù)時(shí)長(zhǎng):9.06小時(shí)
錄音語(yǔ)料:日常朗讀、情感演繹
采樣格式:無(wú)壓縮PCM WAV格式,采樣率為48KHz 16bit
標(biāo)注內(nèi)容:音字標(biāo)注、韻律標(biāo)注
適用領(lǐng)域:有聲閱讀、影視配音等領(lǐng)域
5、巴葡女聲合成庫(kù)
語(yǔ)種:巴西葡萄牙語(yǔ)
采集環(huán)境:專業(yè)錄音棚,信噪比不低于35dB
數(shù)據(jù)時(shí)長(zhǎng):10小時(shí)
錄音語(yǔ)料:日常朗讀
采樣格式:無(wú)壓縮PCM WAV格式,采樣率為48KHz 16bit
標(biāo)注內(nèi)容:音字標(biāo)注、韻律標(biāo)注
適用領(lǐng)域:科研、語(yǔ)音導(dǎo)航、影視配音等領(lǐng)域
歡迎對(duì)以上數(shù)據(jù)集感興趣的行業(yè)伙伴聯(lián)系我們~如果以上數(shù)據(jù)不能滿足您當(dāng)前的需求,標(biāo)貝科技還可以針對(duì)特定人群、特定場(chǎng)景、特定語(yǔ)種提供相應(yīng)的數(shù)據(jù)定制化服務(wù),全力幫助企業(yè)客戶得到滿意的數(shù)據(jù)服務(wù)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。
近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。