上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購(gòu)物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測(cè)試版現(xiàn)已開(kāi)放革命性AI對(duì)話系統(tǒng)Moshi問(wèn)世:機(jī)器也能說(shuō)人話了?阿里國(guó)際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領(lǐng)先的目標(biāo)網(wǎng)絡(luò)AI 3D生成天花板再拉升!清華團(tuán)隊(duì)煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛(ài)“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個(gè)“0元開(kāi)店”類目,推出多項(xiàng)新商入駐權(quán)益年內(nèi)狂攬五項(xiàng)第一,“字節(jié)系大模型”何以后發(fā)先至?
  • 首頁(yè) > 企業(yè)IT頻道 > 大數(shù)據(jù)

    標(biāo)貝科技多語(yǔ)種合成數(shù)據(jù)庫(kù) 助力AI企業(yè)揚(yáng)帆出海

    2022年09月15日 11:32:19   來(lái)源:中文科技資訊

      隨著人工智能、云計(jì)算、5G等新技術(shù)的成熟應(yīng)用,推動(dòng)了全球智能語(yǔ)音產(chǎn)業(yè)進(jìn)一步升級(jí)。而多語(yǔ)種語(yǔ)言互通、復(fù)雜場(chǎng)景交互的實(shí)現(xiàn),也給智能語(yǔ)音市場(chǎng)發(fā)展注入新動(dòng)能。據(jù)中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟《2020-2021中國(guó)智能語(yǔ)音產(chǎn)業(yè)發(fā)展白皮書》數(shù)據(jù)顯示,2020年全球智能語(yǔ)音產(chǎn)業(yè)規(guī)模約為203億美元,預(yù)計(jì)2021年產(chǎn)業(yè)規(guī)模將超過(guò)250億美元。

      其中,歐美等成熟的海外市場(chǎng)具有優(yōu)質(zhì)的消費(fèi)群體和良好的用戶認(rèn)知,印度、東南亞等新興市場(chǎng)則存在蓬勃的市場(chǎng)潛力。處在這樣的經(jīng)濟(jì)大環(huán)境和市場(chǎng)整體趨勢(shì)下,越來(lái)越多的國(guó)內(nèi)企業(yè)瞄準(zhǔn)海外市場(chǎng),開(kāi)始“走出去”戰(zhàn)略。

      多語(yǔ)種數(shù)據(jù)稀缺 語(yǔ)音合成難度大

      對(duì)于主打AI語(yǔ)音產(chǎn)品的企業(yè)來(lái)說(shuō),在競(jìng)爭(zhēng)激烈的出海賽道中,不僅要面對(duì)不同的市場(chǎng)環(huán)境、人文特征、技術(shù)安全等一系列挑戰(zhàn),更需要克服錯(cuò)綜復(fù)雜的語(yǔ)言問(wèn)題,實(shí)現(xiàn)與當(dāng)?shù)赜脩?ldquo;無(wú)障礙溝通”。因此,解決智能語(yǔ)音產(chǎn)品的“說(shuō)話”問(wèn)題,是快速實(shí)現(xiàn)本地適配,打開(kāi)海外市場(chǎng)的首要條件。

      從技術(shù)層面來(lái)看,多語(yǔ)種語(yǔ)音合成的實(shí)現(xiàn),需要根據(jù)語(yǔ)言積累構(gòu)建語(yǔ)種系統(tǒng)。而不同語(yǔ)言之間差異很大,所以需要根據(jù)不同的語(yǔ)言特性單獨(dú)建模。這就需要大量不同語(yǔ)種的數(shù)據(jù)做訓(xùn)練支撐。

      據(jù)了解,目前世界上共有7000多種語(yǔ)言,其中使用人數(shù)超過(guò)5000萬(wàn)的語(yǔ)言僅有10余種。眾多語(yǔ)言中,使用人數(shù)少的小語(yǔ)種采集更加困難。本地口音,小語(yǔ)種訓(xùn)練數(shù)據(jù)匱乏,高昂的制作成本,給語(yǔ)種系統(tǒng)的構(gòu)建帶來(lái)不小的困難。

      高質(zhì)量多語(yǔ)種數(shù)據(jù)集 助力企業(yè)出海

      標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)領(lǐng)域多年,擁有專業(yè)的數(shù)據(jù)處理團(tuán)隊(duì)和強(qiáng)大的數(shù)據(jù)采集、處理能力,在數(shù)據(jù)采集和標(biāo)注方面具備豐富的實(shí)踐經(jīng)驗(yàn)。

      面對(duì)多語(yǔ)種訓(xùn)練語(yǔ)料稀缺的難題,標(biāo)貝科技基于自有高規(guī)格錄音棚、全球優(yōu)質(zhì)聲優(yōu)資源,推出系列多語(yǔ)種合成語(yǔ)音數(shù)據(jù)庫(kù),覆蓋美語(yǔ)、英語(yǔ)、葡語(yǔ)、印尼語(yǔ)、巴葡語(yǔ)、西語(yǔ)、法語(yǔ)、德語(yǔ)、俄語(yǔ)、意大利語(yǔ)、西班牙語(yǔ)、韓語(yǔ)、日語(yǔ)等多語(yǔ)種語(yǔ)言,并完成對(duì)數(shù)據(jù)庫(kù)的音標(biāo)、重音標(biāo)注、韻律標(biāo)注,供算法優(yōu)化直接使用,助力國(guó)內(nèi)智能語(yǔ)音產(chǎn)品化解語(yǔ)言挑戰(zhàn),順利出海。

      部分?jǐn)?shù)據(jù)庫(kù)展示如下:

      1、美語(yǔ)女聲合成庫(kù)

      語(yǔ)種:美式英語(yǔ)

      采集環(huán)境:專業(yè)錄音棚,信噪比不低于35dB

      數(shù)據(jù)時(shí)長(zhǎng):10.27小時(shí)

      錄音語(yǔ)料:日常朗讀

      采樣格式:無(wú)壓縮PCM WAV格式,采樣率為48KHz 16bit

      標(biāo)注內(nèi)容:音字標(biāo)注、韻律標(biāo)注

      適用領(lǐng)域:智能客服、新聞播報(bào)、語(yǔ)音導(dǎo)航等領(lǐng)域

      2、英語(yǔ)男聲合成庫(kù)

      語(yǔ)種:英式英語(yǔ)

      采集環(huán)境:專業(yè)錄音棚,信噪比不低于35dB

      數(shù)據(jù)時(shí)長(zhǎng):30小時(shí)

      錄音語(yǔ)料:英文小說(shuō)

      采樣格式:無(wú)壓縮PCM WAV格式,采樣率為48KHz 16bit

      標(biāo)注內(nèi)容:音字標(biāo)注、韻律標(biāo)注

      適用領(lǐng)域:有聲閱讀、智能客服、產(chǎn)品解說(shuō)等領(lǐng)域

      3、德語(yǔ)男聲合成庫(kù)

      語(yǔ)種:德語(yǔ)

      采集環(huán)境:專業(yè)錄音棚,信噪比不低于35dB

      數(shù)據(jù)時(shí)長(zhǎng):10小時(shí)

      錄音語(yǔ)料:日常朗讀

      采樣格式:無(wú)壓縮PCM WAV格式,采樣率為48KHz 16bit

      標(biāo)注內(nèi)容:音字標(biāo)注、韻律標(biāo)注

      適用領(lǐng)域:智能客服、新聞播報(bào)、語(yǔ)音助手等領(lǐng)域

      4、巴葡青年男聲多風(fēng)格合成庫(kù)

      語(yǔ)種:巴西葡萄牙語(yǔ)

      采集環(huán)境:專業(yè)錄音棚,信噪比不低于35dB

      數(shù)據(jù)時(shí)長(zhǎng):9.06小時(shí)

      錄音語(yǔ)料:日常朗讀、情感演繹

      采樣格式:無(wú)壓縮PCM WAV格式,采樣率為48KHz 16bit

      標(biāo)注內(nèi)容:音字標(biāo)注、韻律標(biāo)注

      適用領(lǐng)域:有聲閱讀、影視配音等領(lǐng)域

      5、巴葡女聲合成庫(kù)

      語(yǔ)種:巴西葡萄牙語(yǔ)

      采集環(huán)境:專業(yè)錄音棚,信噪比不低于35dB

      數(shù)據(jù)時(shí)長(zhǎng):10小時(shí)

      錄音語(yǔ)料:日常朗讀

      采樣格式:無(wú)壓縮PCM WAV格式,采樣率為48KHz 16bit

      標(biāo)注內(nèi)容:音字標(biāo)注、韻律標(biāo)注

      適用領(lǐng)域:科研、語(yǔ)音導(dǎo)航、影視配音等領(lǐng)域

      歡迎對(duì)以上數(shù)據(jù)集感興趣的行業(yè)伙伴聯(lián)系我們~如果以上數(shù)據(jù)不能滿足您當(dāng)前的需求,標(biāo)貝科技還可以針對(duì)特定人群、特定場(chǎng)景、特定語(yǔ)種提供相應(yīng)的數(shù)據(jù)定制化服務(wù),全力幫助企業(yè)客戶得到滿意的數(shù)據(jù)服務(wù)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    [No. H002]
    分享到微信

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。