開車途中,有清晰明快的智能語音導(dǎo)航為你播報(bào)最新路況;
撥打咨詢電話,有溫柔甜美的智能客服為你答疑解惑;
家庭生活里,有活潑可愛的語音助手為你省下不少麻煩操作;
甚至當(dāng)你不想看書,還有各種情感合成聲音為你營(yíng)造帶入感十足的聽書體驗(yàn)……
當(dāng)前,隨著智能語音交互越來越普及,聲音逐漸成為生活中重要的一部分。而合成聲音賦予語音產(chǎn)品不同的“性格”,讓其與用戶的溝通更加“人性化”。
伴隨著語音合成技術(shù)應(yīng)用不斷深入,應(yīng)用場(chǎng)景的日益多樣化對(duì)聲音效果也提出了更高的要求。如何賦予合成聲音更多的情感表現(xiàn)力和個(gè)性化功能,成為各大智能語音產(chǎn)品快速占領(lǐng)市場(chǎng)的核心競(jìng)爭(zhēng)力。
品質(zhì)升級(jí)
為滿足各行業(yè)客戶的多元化商業(yè)需求,此前標(biāo)貝科技已經(jīng)上線了一批24K高保真音色,細(xì)膩飽滿的情感表現(xiàn)力贏得客戶一致好評(píng)。近日,標(biāo)貝科技再上線4個(gè)24K新音色,包括2個(gè)中文發(fā)音人、2個(gè)美式英語發(fā)音人,每個(gè)聲音都經(jīng)過精挑細(xì)選,各有特色。
▍24K中文發(fā)音人
童聲貝童:聲音純真可愛充滿活力,適合故事閱讀、語音助手等場(chǎng)景
男聲貝明:聲音溫和,穩(wěn)重可信,適合智能客服、產(chǎn)品解說等場(chǎng)景
▍24K美式英語發(fā)音人
男聲貝洛伊:聲音清晰明朗,高仿真人,適合新聞播報(bào)、語音導(dǎo)航等場(chǎng)景
女聲貝漢娜:聲音親切自然、富有情感,適合有聲閱讀、影視配音等場(chǎng)景
功能升級(jí)
不僅聲音質(zhì)量提升,此次標(biāo)貝語音合成還全新上線字級(jí)別時(shí)間戳功能,給用戶帶來更便捷的畫音同步體驗(yàn)。
使用智能語音配音的朋友經(jīng)常會(huì)遇到一個(gè)問題:在視頻播放過程中,變成聲波的語音,很難控制目前需要讀到了哪一句、哪個(gè)字,無法靈活實(shí)現(xiàn)聲音字幕和畫面同步匹配的效果。
針對(duì)這個(gè)問題,標(biāo)貝將過去的音子級(jí)別時(shí)間戳優(yōu)化到字級(jí)別時(shí)間戳,即用戶在使用語音合成服務(wù)輸出音頻流時(shí),通過標(biāo)貝字級(jí)別時(shí)間戳,可以實(shí)現(xiàn)實(shí)時(shí)輸出每個(gè)文本在音頻中的時(shí)間位置。尤其是,不僅可以準(zhǔn)確的對(duì)齊文字,數(shù)字、引文、特殊符號(hào)等也能直接對(duì)齊到原始文本,不需要其他轉(zhuǎn)換的工作,有效解決了畫音同步的難題。
在應(yīng)用場(chǎng)景方面,標(biāo)貝字級(jí)別時(shí)間戳可以賦能有聲讀物、視頻配音體驗(yàn)。例如,有聲新聞、有聲故事、兒童讀物等設(shè)備大多支持屏幕根據(jù)播報(bào)聲音顯示文字。但是現(xiàn)有技術(shù)只能做到整行整句顯示字幕,兒童無法根據(jù)聲音來認(rèn)字學(xué)字。標(biāo)貝字級(jí)別時(shí)間戳則可以根據(jù)朗讀的聲音,在設(shè)備屏幕上實(shí)現(xiàn)逐字高亮顯示,讓用戶快速、準(zhǔn)確的定位當(dāng)前播報(bào)的文字,也方便了兒童聽音識(shí)字。
標(biāo)準(zhǔn)化TTS定制 推動(dòng)智能語音產(chǎn)業(yè)規(guī);l(fā)展
據(jù)前瞻網(wǎng)統(tǒng)計(jì),2020年中國(guó)智能語音市場(chǎng)規(guī)模達(dá)到113.96億元,同比增長(zhǎng)19.2%,預(yù)計(jì)2026年中國(guó)智能語音市場(chǎng)規(guī)模將進(jìn)一步增長(zhǎng),達(dá)到326.88億元。隨著人工智能應(yīng)用的普及以及基礎(chǔ)設(shè)施成熟,智能語音作為人機(jī)交互的重要入口,將迎來大規(guī)模商業(yè)化落地階段。
優(yōu)質(zhì)的聲音是智能語音產(chǎn)品獲得良好用戶體驗(yàn)的第一要素。要求合成聲音不僅具備情感表現(xiàn)力,更要匹配當(dāng)前的業(yè)務(wù)場(chǎng)景需求。標(biāo)貝科技基于強(qiáng)大的數(shù)據(jù)能力及深度學(xué)習(xí)技術(shù),提供標(biāo)準(zhǔn)化TTS定制服務(wù),可以滿足不同層面客戶的定制化需求。
例如,賦予智能客服更具人情味的音色,讓用戶感受真實(shí)可靠;打造語音助手的專屬聲音IP,與用戶產(chǎn)生情感互動(dòng);為有聲閱讀提供豐富的情感合成音色,帶來更具沉浸感的聽書體驗(yàn)……
目前,標(biāo)貝科技累計(jì)語音合成音色種類多達(dá)100余種,包括男聲、女聲、老人、童聲等多音色,中文、英文、中英混讀、小語種、方言等多語種,廣泛服務(wù)智慧金融、教育、電子商務(wù)、安防、自動(dòng)駕駛、泛娛樂等多領(lǐng)域。未來,標(biāo)貝科技將繼續(xù)以技術(shù)創(chuàng)新為核心,持續(xù)優(yōu)化服務(wù)能力,打造更優(yōu)質(zhì)、更落地的語音交互方案,為企業(yè)創(chuàng)造更大的商業(yè)價(jià)值,為智能語音產(chǎn)業(yè)高速發(fā)展貢獻(xiàn)力量。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。
近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。