2024年國內(nèi)日系車銷量排行:僅豐田有所增長,其余均遭滑鐵盧同比增長71.8% 比亞迪2024年汽車出口增速位列中國汽車品牌第一消息稱去年全球PC GPU出貨超2.5億顆 較CPU高出兩成蘋果迎頭趕上:iPhone 17系列將搭載VC均熱板,提升散熱性能2024年中國智能手機(jī)市場回暖:vivo領(lǐng)跑,華為增長37%,蘋果下滑17%英偉達(dá)與聯(lián)發(fā)科聯(lián)手打造Windows on Arm旗艦SoC,瞄準(zhǔn)PC市場新藍(lán)海三星Exynos旗艦芯片量產(chǎn)受阻,臺(tái)積電拒絕為其代工 擔(dān)憂商業(yè)機(jī)密泄露M4芯片MacBook Air有望成蘋果今年首款新品 最快1月份發(fā)布微軟入局量子計(jì)算 帶動(dòng)量子概念股暴力反彈消息稱東鵬飲料正與大摩和瑞銀接觸 即將赴港上市盒馬換帥300天:狂飆拓店、加速下沉、開放加盟AMD:RX 9070系列顯卡值得一場專屬發(fā)布會(huì)小米4000-5000價(jià)位段市占率第一!將重點(diǎn)突破6000元以上價(jià)位段王者榮耀鴻蒙版正式上線:資產(chǎn)完整保留 全平臺(tái)互通匹配春節(jié)返鄉(xiāng)開車的“面子”之爭:BBA和新勢力誰更有排面?阿里云通義開源最強(qiáng)過程獎(jiǎng)勵(lì)PRM模型 7B尺寸比GPT-4o更能發(fā)現(xiàn)推理錯(cuò)誤嵐圖汽車2024擠上牌桌:牽手華為智能化,靠夢想家扳回一局!翻譯軟件迎接小紅書潑天“洋流量”:百度、有道、谷歌哪家強(qiáng)?彩色電子紙平板突然火了:銷量暴增2倍 逐步成閱讀器首選OPPO Find N5折疊厚度不到9.2mm:全球最薄折疊屏
首頁 > 延展閱讀 > 2016歸檔

97%之后 百度再尋語音突破口——Deep CNN

2016年11月03日 14:01:37 中文科技資訊

  近日,百度在語音識(shí)別技術(shù)方面再獲突破,將圖像識(shí)別技術(shù)成功“跨界”到語音領(lǐng)域,利用深層卷積神經(jīng)網(wǎng)絡(luò)(Deep CNN)應(yīng)用于語音識(shí)別聲學(xué)建模中,將其與基于長短時(shí)記憶單元(LSTM)和連接時(shí)序分類(CTC)的端對(duì)端語音識(shí)別技術(shù)相結(jié)合,錯(cuò)誤率相對(duì)降低10%,大幅度提升語音識(shí)別產(chǎn)品性能,是繼端對(duì)端語音識(shí)別后取得的另一次重大技術(shù)突破。

  Deep CNN語音識(shí)別的建模過程

  近年來,運(yùn)用CNN技術(shù)的圖像識(shí)別成果頗豐,越來越深的CNN不斷刷新著圖像識(shí)別的精準(zhǔn)度,以人臉識(shí)別為例,識(shí)別準(zhǔn)確率高達(dá)99.7%。但CNN的進(jìn)展在語音識(shí)別方面沒有得到充分的應(yīng)用。作為一家在語音技術(shù)上有著深入研究的人工智能公司,百度將Deep CNN視為語音識(shí)別技術(shù)的下一個(gè)突破口。

  ImageNet競賽中,越來越深的CNN不斷刷新著其性能

  在商用領(lǐng)域的端對(duì)端語音識(shí)別技術(shù)中,百度首次嘗試引入更深層的CNN神經(jīng)網(wǎng)絡(luò),使錯(cuò)誤率相對(duì)降低10%。端對(duì)端技術(shù)則使用一個(gè)單獨(dú)的學(xué)習(xí)算法來完成從任務(wù)輸入端到輸出端的所有過程,減少了中間單元以及人為干預(yù),在海量數(shù)據(jù)的支持下模型效果提升明顯。目前,百度的端對(duì)端技術(shù)處于業(yè)界領(lǐng)先水平。值得一提的是,語音識(shí)別都是基于時(shí)頻分析后的語音譜完成的,將整個(gè)語音信號(hào)分析得到的時(shí)頻譜當(dāng)作一張圖像,就可以采用圖像中已廣泛應(yīng)用的CNN進(jìn)行識(shí)別,克服了語音信號(hào)多樣性的問題,且通過引入更深層的CNN,使語音識(shí)別性能得到顯著提升,正如百度語音技術(shù)部識(shí)別技術(shù)負(fù)責(zé)人李先剛博士所言:‘The Deeper,The Better’。

  與學(xué)術(shù)研究不同,百度語音的研發(fā)立足點(diǎn),聚焦于技術(shù)的實(shí)際應(yīng)用,技術(shù)難度和實(shí)現(xiàn)程度更高。針對(duì)語音識(shí)別產(chǎn)品而言,必須具備在大規(guī)模語音數(shù)據(jù)庫上體現(xiàn)性能提升以及具有適合語音在線識(shí)別產(chǎn)品運(yùn)行的模型。百度采用數(shù)千小時(shí)進(jìn)行實(shí)驗(yàn)的研究,并在近十萬小時(shí)的產(chǎn)品語音數(shù)據(jù)庫中進(jìn)行驗(yàn)證,且充足的語音數(shù)據(jù)資源,使基于端對(duì)端技術(shù)的語音識(shí)別系統(tǒng)明顯優(yōu)于以往的框架性能。

  百度語音識(shí)別技術(shù)每年迭代算法模型

  除此之外,百度語音技術(shù)在數(shù)據(jù)、計(jì)算能力、算法等三方面優(yōu)勢顯著。百度擁有約10萬小時(shí)的精準(zhǔn)標(biāo)注語音數(shù)據(jù),以及基于數(shù)百個(gè)GPU的高性能計(jì)算平臺(tái)。在算法方面,百度每年都在不斷優(yōu)化、迭代模型算法,語音識(shí)別效果顯著提升,領(lǐng)先業(yè)界。

  此前,百度便利用端對(duì)端技術(shù)研發(fā)了Deep Speech 2深度語音識(shí)別技術(shù),用于提高在嘈雜環(huán)境下語音識(shí)別的準(zhǔn)確率。在噪音環(huán)境下,其錯(cuò)誤率低于谷歌、微軟以及蘋果的語音系統(tǒng)。目前,百度語音識(shí)別準(zhǔn)確率高達(dá)97%,并被美國權(quán)威科技雜志《麻省理工評(píng)論》列為2016年十大突破技術(shù)之一。另據(jù)李先剛博士透露,目前的確正在加緊Deep Speech 3 的研發(fā)工作,而本次公布的Deep CNN不排除將會(huì)是Deep Speech 3的核心組成部分。

  除了技術(shù)突破,百度還積極推動(dòng)用戶使用語音交互的普及,手機(jī)百度、百度輸入法、百度地圖、度秘等產(chǎn)品都已支持語音輸入功能,而此次“跨界”的Deep CNN相信很快會(huì)應(yīng)用到擁有龐大用戶體量的百度產(chǎn)品中。

  來源:XXX(非中文科技資訊)的作品均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載請(qǐng)尊重版權(quán)保留出處,一切法律責(zé)任自負(fù)。

  文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。有事發(fā)郵件至news#citnews.com.cn(發(fā)送時(shí)將#替換為@)。

[信息來源:中國網(wǎng)]

[上傳用戶: ]

[轉(zhuǎn)載標(biāo)題:]
分享到微信

即時(shí)

新聞

明火炊具市場:三季度健康屬性貫穿全類目

奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

企業(yè)IT

重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

3C消費(fèi)

華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。

研究

中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。