A系列最大電池!OPPO A5入網(wǎng):6330mAh超越A5 ProOPPO Find X8 Ultra渲染圖首曝:外觀與Pro版幾乎一致微軟重申Win10將結(jié)束支持!督促趕緊升級(jí)Win11:不升用不了Microsoft 365六年磨一劍!iPhone 17 Air真機(jī)泄露:橫向三攝設(shè)計(jì)大變革小米超級(jí)小愛(ài)升級(jí)計(jì)劃公布:小米13/K60等也能用上 1月27日前推送摩托羅拉新款折疊屏手機(jī)或提前發(fā)布 型號(hào)XT2551獲印度BIS認(rèn)證攬獲多項(xiàng)CES 2025科技大獎(jiǎng),蟬聯(lián)全球消費(fèi)電子品牌TOP10國(guó)產(chǎn)動(dòng)畫(huà)電影《哪吒之魔童鬧!沸既姹旧嫌常褐С諭MAX、CINITY等多制式擎朗智能攜手科大訊飛,共啟具身智能服務(wù)機(jī)器人新征程“借機(jī)玩!保慷嗉一ヂ(lián)網(wǎng)公司在小紅書(shū)發(fā)英文貼攬客OPPO Find X8 Ultra渲染圖曝光:外觀設(shè)計(jì)基本保持不變1月16日發(fā)布!真我14 Pro系列官宣:全球首款溫感變色手機(jī)三星Galaxy S25 Slim細(xì)節(jié)曝光:厚度僅6.5mm 對(duì)標(biāo)iPhone 17 Air斥資134億!TCL買下LG顯示廣州廠訊飛星火X1成為全國(guó)產(chǎn)算力平臺(tái)上唯一的深度推理大模型董明珠稱格力自研芯片設(shè)計(jì)制造封裝全鏈條完成微軟再次強(qiáng)調(diào)Win10將于10月14日終止支持,敦促用戶免費(fèi)升級(jí)至Win11Arm曾考慮將授權(quán)價(jià)格提高300% 并曾探討設(shè)計(jì)自有芯片OpenAI推出新功能“Tasks” ChatGPT可變身成AI私人助理三星Galaxy S25系列手機(jī)AI創(chuàng)作新境界:語(yǔ)音/文字加持“草圖轉(zhuǎn)圖像”
  • 首頁(yè) > 產(chǎn)經(jīng)新聞?lì)l道 > 業(yè)界新聞

    喧鬧中你也能辨識(shí)熟人聲音 谷歌AI也想做到這點(diǎn)

    2018年04月16日 09:53:37   來(lái)源:網(wǎng)易科技

      4月16日消息,據(jù)Ars Technica報(bào)道,谷歌研究人員開(kāi)發(fā)出一種深度學(xué)習(xí)系統(tǒng),旨在幫助計(jì)算機(jī)更好地識(shí)別和分離出嘈雜環(huán)境中的個(gè)體聲音。

      正如谷歌本周在Google Research Blog上所稱,該公司內(nèi)部團(tuán)隊(duì)正試圖復(fù)制“人類大腦專注于某個(gè)聲音來(lái)源同時(shí)可過(guò)濾掉其他聲音”這種能力,就像你在就會(huì)上只與某個(gè)朋友交談。谷歌的方法中使用了一個(gè)視聽(tīng)模型,所以它主要集中于在視頻中隔離聲音。該公司發(fā)布了些YouTube視頻,展示了該技術(shù)的實(shí)際應(yīng)用情況。

      谷歌表示,這項(xiàng)技術(shù)可以應(yīng)用與使用單一音軌的視頻,并能在視頻算法中隔離聲音,這取決于誰(shuí)在說(shuō)話,或者是讓用戶手動(dòng)選擇他們想聽(tīng)到的聲音的人臉。谷歌稱,這里的視覺(jué)組件是關(guān)鍵,因?yàn)楫?dāng)某人的嘴在動(dòng)時(shí),這項(xiàng)技術(shù)會(huì)觀察到,以便能在特定時(shí)刻更好地識(shí)別在某人的聲音,并為視頻的長(zhǎng)度創(chuàng)建更精確的個(gè)人語(yǔ)音軌跡。

      這篇博客文章寫(xiě)道,研究人員在YouTube上收集了10萬(wàn)段“講座和談話”視頻,從這些視頻中提取了近2000小時(shí)的視頻片段,并將音頻與人工背景噪聲混合,創(chuàng)造了“合成雞尾酒派對(duì)”。然后谷歌通過(guò)閱讀人們?cè)诿總(gè)視頻框架中說(shuō)話的“臉縮略圖”和該視頻原聲帶的譜圖,訓(xùn)練技術(shù)人員將混合音頻進(jìn)行拆分。該系統(tǒng)能夠分辨出哪個(gè)音頻源在給定的時(shí)間內(nèi)屬于哪張人臉,并為每個(gè)揚(yáng)聲器創(chuàng)建單獨(dú)的語(yǔ)音軌跡。

      谷歌特別指出,封閉字幕系統(tǒng)是該系統(tǒng)的一個(gè)優(yōu)勢(shì),但該公司表示,它設(shè)想了“這一技術(shù)的廣泛應(yīng)用”,并且“目前正在探索將其納入各種谷歌產(chǎn)品的機(jī)會(huì)”。Hangouts和YouTube似乎是兩個(gè)容易起步的地方。當(dāng)應(yīng)用到智能眼鏡(比如谷歌眼鏡、語(yǔ)音放大耳塞)中時(shí),不難看出該技術(shù)是如何工作的。

      幫助像谷歌Home這樣的智能音箱識(shí)別個(gè)人聲音,這似乎是另一個(gè)用例,但是因?yàn)檫@個(gè)模型集中在視頻上,它可能與配有顯示器的智能音箱合作效果會(huì)更好,比如亞馬遜的Echo Show。今年早些時(shí)候,谷歌為“智能顯示設(shè)備”(如Echo Show)集成了Google Assistant,但該公司還沒(méi)有發(fā)布自己的類似硬件產(chǎn)品。

      在任何情況下,這種技術(shù)的隱私后果似乎和潛在的用例同樣明顯。在上面的例子中,谷歌的聲音隔離遠(yuǎn)遠(yuǎn)不是安全無(wú)憂的,進(jìn)行更細(xì)微的調(diào)整后,它可以讓強(qiáng)大的竊聽(tīng)和監(jiān)視工具落入壞人之手。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。