小米AI算法能力登頂聲音識(shí)別領(lǐng)域高峰，AI全面賦能業(yè)務(wù)再進(jìn)一步

2023年09月13日 17:22:02 來源：DoNews

　　近日，小米自研聲音識(shí)別算法取得最新進(jìn)展，算法模型領(lǐng)先其他機(jī)構(gòu)，性能國(guó)際排名第一。小米是在 Google 發(fā)布的 AudioSet 音頻標(biāo)記任務(wù)中獲得的這一突破。

　　它是音頻標(biāo)記任務(wù)影響力最大的數(shù)據(jù)集，被認(rèn)為是聲音領(lǐng)域的 ImageNet (注：計(jì)算機(jī)視覺領(lǐng)域最著名的數(shù)據(jù)集，由著名學(xué)者李飛飛等主持發(fā)布)，權(quán)威性頗高。

　　Google 將 AudioSet 數(shù)據(jù)集分為三個(gè)子集，前兩個(gè)子集用于訓(xùn)練，被合并稱為 “AudioSet-2M”。正是在這個(gè)合并后的訓(xùn)練集中，小米的聲音識(shí)別算法模型首次在業(yè)界突破了50 mAP，刷新了音頻標(biāo)記技術(shù)指標(biāo)，成為截至目前性能最好的模型。

　　此外，小米還發(fā)布了一個(gè) Mini 版模型，適合資源受限的場(chǎng)景。該模型的參數(shù)量被壓縮到了原模型的約九分之一，遠(yuǎn)小于其他機(jī)構(gòu)的模型，但性能卻優(yōu)于其他所有機(jī)構(gòu)。

　　這項(xiàng)技術(shù)的突破意味著小米的聲音識(shí)別算法能力再次精進(jìn)，小米的眾多智能硬件設(shè)備應(yīng)用此項(xiàng)技術(shù)后，可以更敏銳地捕捉和識(shí)別環(huán)境聲音，大幅提升硬件的智能化程度，從而為用戶創(chuàng)造更加便捷的智能生活體驗(yàn)。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信