阿里云通義千問(wèn)開(kāi)源兩款語(yǔ)音基座模型，識(shí)別效果優(yōu)于 OpenAI Whisper

2024年07月09日 11:12:59 沛霖來(lái)源：IT之家

　　阿里云通義千問(wèn)開(kāi)源了兩款語(yǔ)音基座模型 SenseVoice(用于語(yǔ)音識(shí)別)和 CosyVoice(用于語(yǔ)音生成)。

　　SenseVoice 專注于高精度多語(yǔ)言語(yǔ)音識(shí)別、情感辨識(shí)和音頻事件檢測(cè)，有以下特點(diǎn)：

　　多語(yǔ)言識(shí)別：采用超過(guò) 40 萬(wàn)小時(shí)數(shù)據(jù)訓(xùn)練，支持超過(guò) 50 種語(yǔ)言，識(shí)別效果上優(yōu)于 Whisper 模型

　　富文本識(shí)別：具備優(yōu)秀的情感識(shí)別，能夠在測(cè)試數(shù)據(jù)上達(dá)到和超過(guò)目前最佳情感識(shí)別模型的效果;支持聲音事件檢測(cè)能力，支持音樂(lè)、掌聲、笑聲、哭聲、咳嗽、噴嚏等多種常見(jiàn)人機(jī)交互事件進(jìn)行檢測(cè)

　　高效推理： SenseVoice-Small 模型采用非自回歸端到端框架，推理延遲極低，10s 音頻推理僅耗時(shí) 70ms，15 倍優(yōu)于 Whisper-Large

　　微調(diào)定制：具備便捷的微調(diào)腳本與策略，方便用戶根據(jù)業(yè)務(wù)場(chǎng)景修復(fù)長(zhǎng)尾樣本問(wèn)題

　　服務(wù)部署：具有完整的服務(wù)部署鏈路，支持多并發(fā)請(qǐng)求，支持的客戶端語(yǔ)言有 python、c++、html、java 與 c#等

　　與開(kāi)源情感識(shí)別模型進(jìn)行對(duì)比，SenseVoice-Large 模型可以在幾乎所有數(shù)據(jù)上都達(dá)到了最佳效果，而 SenseVoice-Small 模型同樣可以在多數(shù)數(shù)據(jù)集上取得超越其他開(kāi)源模型的效果。

　　CosyVoice 模型同樣支持多語(yǔ)言、音色和情感控制，該模型在多語(yǔ)言語(yǔ)音、零樣本語(yǔ)音生成、跨語(yǔ)言語(yǔ)音克隆和指令跟隨等功能方面表現(xiàn)出色。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信

即時(shí)

TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng)，展示全球科技創(chuàng)新力量

近日，德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革，全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng)，有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

OPPO續(xù)約歐洲冠軍聯(lián)賽未來(lái)三季再續(xù)輝煌

華為見(jiàn)非凡品牌盛典及鴻蒙智行新品發(fā)布會(huì)定檔 9月10日

新聞

敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

近日，中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相，以敢為精神勇闖技術(shù)無(wú)人區(qū)，斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

企業(yè)IT

重慶創(chuàng)新公積金應(yīng)用，“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

“以前都要去窗口辦，一套流程下來(lái)都要半個(gè)月了，現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序，按照提示流程提交相關(guān)材料，僅幾秒鐘，重慶市民曾某的賬戶就打進(jìn)了21600元。

3C消費(fèi)

“純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

2024年3月12日，由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

研究

2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo)，由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”，將于2024年3月23日至24日舉辦。

專題

2021 CCF全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)

返回主頁(yè) ┊ 關(guān)于我們 ┊ 內(nèi)容聯(lián)系 ┊ 聯(lián)系我們 ┊ 免責(zé)聲明 ┊ 原創(chuàng)新聞 ┊ 友情鏈接 ┊ 舊版首頁(yè)

感谢您访问我们的网站，您可能还对以下资源感兴趣：
台湾中文娱乐网
久久精品视频国产女人扒开腿让人桶视频男女做爰猛烈叫床视频免费 99精品久久久中文字幕欧美日韩一区精品视频

阿里云通義千問(wèn)開(kāi)源兩款語(yǔ)音基座模型，識(shí)別效果優(yōu)于 OpenAI Whisper

擴(kuò)展閱讀