近日,百度輸入法發(fā)布V7.4版,并推出“輕聲識(shí)別”等新功能,讓用戶在語音錄入私密話題,或公共場合下能夠使用“耳語”進(jìn)行語音輸入,讓手機(jī)也能聽懂“悄悄話”。
語音輸入功能方便快捷,為何用戶還會(huì)首選文字而非語音進(jìn)行輸入呢?據(jù)調(diào)查數(shù)據(jù)顯示,絕大多數(shù)用戶在表達(dá)內(nèi)容涉及隱私,或當(dāng)時(shí)的場合不適宜大聲說話時(shí)會(huì)選擇手動(dòng)鍵入內(nèi)容來代替語音輸入。不少用戶都表示,如果手機(jī)可以識(shí)別“小聲說話”的內(nèi)容,便可解決大多數(shù)安靜情況下語音輸入的痛點(diǎn)。
百度輸入法的“輕聲識(shí)別”功能可升級(jí)輸入法“聽力”,用戶的“悄悄話”也能聽懂。據(jù)了解,耳語語音較之正常語音有兩大不同點(diǎn),一是耳語語音音量比正常音量要低很多,二是人們在輕聲說話的時(shí)候,由于不經(jīng)過聲帶振動(dòng),因此不存在基頻,也不會(huì)產(chǎn)生相應(yīng)的各次諧波,導(dǎo)致耳語的頻譜特性與正常語音完全不同,極大增加技術(shù)研發(fā)難度。
針對(duì)耳語語音的特殊性,百度輸入法依托人工智能技術(shù),采取主動(dòng)學(xué)習(xí)的方式,通過基音檢測和諧波分析技術(shù),挑選出符合耳語特性的數(shù)據(jù),作為百度輸入法“輕聲識(shí)別”的訓(xùn)練集和開發(fā)集。挑選出的耳語數(shù)據(jù)經(jīng)過標(biāo)注后,作為訓(xùn)練數(shù)據(jù)放在聲學(xué)模型上進(jìn)行適配,使得已有聲學(xué)模型能夠快速適配耳語語音特性。
隨著語音識(shí)別技術(shù)的不斷發(fā)展,百度在語音輸入方面頻頻發(fā)力。在此前發(fā)布的V7.3版本中,百度輸入法創(chuàng)新性的推出了長文本語音輸入等語音輸入新功能。2017年初,百度推出的網(wǎng)頁應(yīng)用SwiftScribe可以將音頻文件轉(zhuǎn)為文本,時(shí)長1分鐘的音頻文件可以在30秒內(nèi)轉(zhuǎn)換完成,轉(zhuǎn)化效率較人工速記快 1.67倍,極大提升速記行業(yè)轉(zhuǎn)錄效率。
業(yè)內(nèi)人士指出,百度輸入法的“輕聲識(shí)別”功能具有聲音低、識(shí)別準(zhǔn)、速度快的特點(diǎn),將拓展用戶語音輸入的使用場景,并培養(yǎng)用戶的語音使用習(xí)慣,“輕聲識(shí)別”功能的上線為語音輸入法市場帶來一抹亮色,通過人工智能技術(shù)對(duì)輸入法產(chǎn)品的加持,提升用戶的輸入體驗(yàn),同時(shí)也將在輸入法行業(yè)掀起人工智能浪潮。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。