中國品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性
  • 首頁 > 產(chǎn)經(jīng)新聞?lì)l道 > 業(yè)界新聞

    喧鬧中你也能辨識(shí)熟人聲音 谷歌AI也想做到這點(diǎn)

    2018年04月16日 09:53:37   來源:網(wǎng)易科技

      4月16日消息,據(jù)Ars Technica報(bào)道,谷歌研究人員開發(fā)出一種深度學(xué)習(xí)系統(tǒng),旨在幫助計(jì)算機(jī)更好地識(shí)別和分離出嘈雜環(huán)境中的個(gè)體聲音。

      正如谷歌本周在Google Research Blog上所稱,該公司內(nèi)部團(tuán)隊(duì)正試圖復(fù)制“人類大腦專注于某個(gè)聲音來源同時(shí)可過濾掉其他聲音”這種能力,就像你在就會(huì)上只與某個(gè)朋友交談。谷歌的方法中使用了一個(gè)視聽模型,所以它主要集中于在視頻中隔離聲音。該公司發(fā)布了些YouTube視頻,展示了該技術(shù)的實(shí)際應(yīng)用情況。

      谷歌表示,這項(xiàng)技術(shù)可以應(yīng)用與使用單一音軌的視頻,并能在視頻算法中隔離聲音,這取決于誰在說話,或者是讓用戶手動(dòng)選擇他們想聽到的聲音的人臉。谷歌稱,這里的視覺組件是關(guān)鍵,因?yàn)楫?dāng)某人的嘴在動(dòng)時(shí),這項(xiàng)技術(shù)會(huì)觀察到,以便能在特定時(shí)刻更好地識(shí)別在某人的聲音,并為視頻的長度創(chuàng)建更精確的個(gè)人語音軌跡。

      這篇博客文章寫道,研究人員在YouTube上收集了10萬段“講座和談話”視頻,從這些視頻中提取了近2000小時(shí)的視頻片段,并將音頻與人工背景噪聲混合,創(chuàng)造了“合成雞尾酒派對(duì)”。然后谷歌通過閱讀人們在每個(gè)視頻框架中說話的“臉縮略圖”和該視頻原聲帶的譜圖,訓(xùn)練技術(shù)人員將混合音頻進(jìn)行拆分。該系統(tǒng)能夠分辨出哪個(gè)音頻源在給定的時(shí)間內(nèi)屬于哪張人臉,并為每個(gè)揚(yáng)聲器創(chuàng)建單獨(dú)的語音軌跡。

      谷歌特別指出,封閉字幕系統(tǒng)是該系統(tǒng)的一個(gè)優(yōu)勢,但該公司表示,它設(shè)想了“這一技術(shù)的廣泛應(yīng)用”,并且“目前正在探索將其納入各種谷歌產(chǎn)品的機(jī)會(huì)”。Hangouts和YouTube似乎是兩個(gè)容易起步的地方。當(dāng)應(yīng)用到智能眼鏡(比如谷歌眼鏡、語音放大耳塞)中時(shí),不難看出該技術(shù)是如何工作的。

      幫助像谷歌Home這樣的智能音箱識(shí)別個(gè)人聲音,這似乎是另一個(gè)用例,但是因?yàn)檫@個(gè)模型集中在視頻上,它可能與配有顯示器的智能音箱合作效果會(huì)更好,比如亞馬遜的Echo Show。今年早些時(shí)候,谷歌為“智能顯示設(shè)備”(如Echo Show)集成了Google Assistant,但該公司還沒有發(fā)布自己的類似硬件產(chǎn)品。

      在任何情況下,這種技術(shù)的隱私后果似乎和潛在的用例同樣明顯。在上面的例子中,谷歌的聲音隔離遠(yuǎn)遠(yuǎn)不是安全無憂的,進(jìn)行更細(xì)微的調(diào)整后,它可以讓強(qiáng)大的竊聽和監(jiān)視工具落入壞人之手。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。