隨著人工智能新一輪浪潮興起,AI語(yǔ)音對(duì)話技術(shù)日趨成熟,帶來(lái)越來(lái)越好的智能語(yǔ)音交互體驗(yàn)。特別是以AI語(yǔ)音助手為代表的語(yǔ)音交互功能已經(jīng)得到充分落地應(yīng)用,如智能穿戴產(chǎn)品、智能車(chē)載設(shè)備以及智能家居等。用戶只需要喚醒語(yǔ)音助手,發(fā)出相應(yīng)的指令,智能產(chǎn)品就可以“聽(tīng)懂”指令,幫助我們完成打電話、查天氣以及導(dǎo)航等需求。
面對(duì)智能語(yǔ)音交互穩(wěn)步增長(zhǎng)的市場(chǎng)空間,國(guó)內(nèi)外企業(yè)紛紛加入布局,搶占市場(chǎng)先機(jī)。不僅促進(jìn)了語(yǔ)音識(shí)別技術(shù)市場(chǎng)的不斷繁榮,同時(shí)也對(duì)多語(yǔ)種語(yǔ)音技術(shù)能力提出了更高要求。
多語(yǔ)種語(yǔ)音識(shí)別難度大
智能語(yǔ)音產(chǎn)品想要“聽(tīng)懂”不同的語(yǔ)言,取決于多語(yǔ)種AI語(yǔ)音識(shí)別技術(shù)的實(shí)現(xiàn)。而且語(yǔ)料庫(kù)越豐富,語(yǔ)言識(shí)別模型的質(zhì)量就越好,最終的語(yǔ)音識(shí)別準(zhǔn)確率也越高。據(jù)統(tǒng)計(jì),目前世界上共有7000多種語(yǔ)言,小于百萬(wàn)人群使用的小語(yǔ)種占據(jù)世界所有語(yǔ)種的80%。盡管市場(chǎng)上已經(jīng)有部分智能翻譯設(shè)備的中英文翻譯效果已經(jīng)達(dá)到專業(yè)水平,但由于語(yǔ)言眾多,發(fā)音體系、發(fā)音技巧各不相同,多語(yǔ)種的語(yǔ)音識(shí)別仍面臨極大挑戰(zhàn)。
語(yǔ)料資源稀缺。 多語(yǔ)種語(yǔ)音數(shù)據(jù)難以獲取不僅表現(xiàn)在語(yǔ)音上,更表現(xiàn)在語(yǔ)料,發(fā)音詞典,標(biāo)注資源上。對(duì)于部分小語(yǔ)種,姑且不說(shuō)上萬(wàn)小時(shí)語(yǔ)音數(shù)據(jù),就連100小時(shí)標(biāo)注數(shù)據(jù)的獲取也舉步維艱。
語(yǔ)言的復(fù)雜性和各異性。不同語(yǔ)言在語(yǔ)音和語(yǔ)法層次有很大差異,開(kāi)發(fā)商需要根據(jù)不同的語(yǔ)言特性單獨(dú)建立語(yǔ)言模型。而建立模型還是要基于大量的數(shù)據(jù)做訓(xùn)練支撐。
多元化差異。 地方口音、口語(yǔ)用詞、網(wǎng)絡(luò)用語(yǔ)等差異導(dǎo)致各語(yǔ)種隨人群不同,具有很強(qiáng)的隨意性,也會(huì)給語(yǔ)音識(shí)別系統(tǒng)帶來(lái)極大挑戰(zhàn)。
搜集覆蓋領(lǐng)域廣、覆蓋說(shuō)話人多、需求量大的多語(yǔ)種語(yǔ)音數(shù)據(jù)成為語(yǔ)音識(shí)別技術(shù)的一大瓶頸。
標(biāo)貝科技多語(yǔ)種識(shí)別數(shù)據(jù)解決方案
標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)領(lǐng)域多年,擁有專業(yè)的數(shù)據(jù)處理團(tuán)隊(duì)和強(qiáng)大的數(shù)據(jù)采集、處理能力,在數(shù)據(jù)采集和標(biāo)注方面具備豐富的實(shí)踐經(jīng)驗(yàn)。
面對(duì)多語(yǔ)種識(shí)別訓(xùn)練語(yǔ)料稀缺的難題,標(biāo)貝科技推出系列多語(yǔ)種語(yǔ)音識(shí)別數(shù)據(jù)庫(kù),覆蓋美式英語(yǔ)、英式英語(yǔ)、韓語(yǔ)、法語(yǔ)、西班牙語(yǔ)、俄語(yǔ)、阿拉伯語(yǔ)等多語(yǔ)種。使用高保真麥克風(fēng)、iOS端、Android端采集錄制并對(duì)齊,語(yǔ)音識(shí)別系統(tǒng)對(duì)于高保真麥克、iOS端、Android端的音頻均適配。并根據(jù)音頻對(duì)說(shuō)話人進(jìn)行標(biāo)注,注明了男女性別屬性,句準(zhǔn)率超過(guò)95%。
西班牙語(yǔ)自由交談數(shù)據(jù)庫(kù)
語(yǔ)種:西班牙語(yǔ)
錄音環(huán)境:室內(nèi)
數(shù)據(jù)時(shí)長(zhǎng):100小時(shí)
錄音設(shè)備:高保真麥克風(fēng)、安卓手機(jī)、蘋(píng)果手機(jī)等錄制
錄音參數(shù):16KHz,16Bit,單聲道,Wav格式存儲(chǔ)
適用領(lǐng)域:智能家居、智能搜索、語(yǔ)音助手等
法語(yǔ)自由交談數(shù)據(jù)庫(kù)
語(yǔ)種:法語(yǔ)
錄音環(huán)境:室內(nèi)
數(shù)據(jù)時(shí)長(zhǎng):100小時(shí)
錄音設(shè)備:高保真麥克風(fēng)、安卓手機(jī)、蘋(píng)果手機(jī)等錄制
錄音參數(shù):16KHz,16Bit,單聲道,Wav格式存儲(chǔ)
適用領(lǐng)域:智能車(chē)載設(shè)備、有聲閱讀、語(yǔ)音助手等
另外,標(biāo)貝科技還打造了阿拉伯語(yǔ)、俄語(yǔ)、美式英語(yǔ)等多語(yǔ)種自由交談庫(kù),以及韓語(yǔ)、英式英語(yǔ)等朗讀語(yǔ)音庫(kù),覆蓋智能家居、智能駕駛、有聲閱讀、智能安防、智能搜索等多個(gè)業(yè)務(wù)場(chǎng)景,推動(dòng)智能語(yǔ)音產(chǎn)品快速落地應(yīng)用。
歡迎對(duì)以上數(shù)據(jù)集感興趣的行業(yè)伙伴聯(lián)系我們~
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。