5月16日,全球無障礙宣傳日之際,騰訊優(yōu)圖實(shí)驗(yàn)室宣布攻克AI手語識(shí)別技術(shù)挑戰(zhàn),聯(lián)合深圳市信息無障礙研究會(huì)發(fā)布“優(yōu)圖AI手語翻譯機(jī)”,致力于通過人工智能技術(shù)為聽障人群搭建無障礙溝通平臺(tái)。
據(jù)優(yōu)圖實(shí)驗(yàn)室AI手語識(shí)別項(xiàng)目組研究員陽趙陽介紹,優(yōu)圖AI手語翻譯機(jī)以普通攝像頭作為手語采集裝置,依托高性能計(jì)算機(jī)進(jìn)行后臺(tái)運(yùn)算,用戶只需面對(duì)攝像頭完成手語表達(dá),翻譯機(jī)屏幕界面就能快速把手語轉(zhuǎn)換為文字,幫助聽障人士和普通人進(jìn)行正常交流,未來有望在機(jī)場(chǎng)、高鐵、民政窗口等公共場(chǎng)所部署應(yīng)用,助力信息無障礙城市建設(shè)。
這也是繼本月初優(yōu)圖實(shí)驗(yàn)室宣布通過人工智能技術(shù)幫助警方尋回多名被拐超過10年兒童之后,騰訊踐行“科技向善”理念的又一體現(xiàn),也是騰訊在計(jì)算機(jī)視覺人工智能領(lǐng)域的又一重大技術(shù)突破。
(優(yōu)圖AI手語翻譯機(jī)界面)
攻克手語識(shí)別難題,自研算法解決溝通障礙
據(jù)世界衛(wèi)生組織最新數(shù)據(jù)顯示,目前全球約有4.66億人患有殘疾性聽力損失,超過全世界人口的5%;據(jù)估計(jì),到2050年這一數(shù)字將達(dá)到9億,全球?qū)⒂屑s十分之一的人出現(xiàn)殘疾性聽力損失。據(jù)北京聽力協(xié)會(huì)2017年預(yù)估數(shù)據(jù),國內(nèi)殘疾性聽力障礙人士已達(dá)7200萬。
雖然我國在信息無障礙領(lǐng)域的投入在逐漸增加,但聽障人群的一些需求仍得不到滿足,尤其在公共環(huán)境設(shè)施、服務(wù)體驗(yàn)等方面。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),我國目前致力于聽障者專業(yè)服務(wù)的人士只有大約一萬名,大部分公共服務(wù)并沒有配備專門的便利設(shè)施,這些都是聽障者長久以來面臨的迫切需求。
針對(duì)這一社會(huì)痛點(diǎn),優(yōu)圖團(tuán)隊(duì)首次將計(jì)算機(jī)視覺人工智能技術(shù)應(yīng)用到手語識(shí)別場(chǎng)景,而此次發(fā)布的“優(yōu)圖AI手語翻譯機(jī)”產(chǎn)品,通過一臺(tái)搭載高性能計(jì)算機(jī)的終端,可以識(shí)別聽障人士的手語,并快速識(shí)別翻譯成文字。
據(jù)騰訊優(yōu)圖研究員陽趙陽介紹,手語翻譯的核心技術(shù)是手語識(shí)別(SLR),通過計(jì)算機(jī)算法,自動(dòng)區(qū)分手語表達(dá)中的各類手勢(shì)、動(dòng)作、手勢(shì)和動(dòng)作之間的切換,最后將手語翻譯成為文字。此前也有一些團(tuán)隊(duì)探索人工智能技術(shù)在聽障無障礙方面的技術(shù)探索,但往往需要借助于一些額外的設(shè)備或傳感器,不僅增加了使用門檻并且無法對(duì)復(fù)雜手語表達(dá)的識(shí)別率。但受限于手語特有的地域性、復(fù)雜性和多樣性,使得這些手語識(shí)別研究即使在深度學(xué)習(xí)的幫助下也依然存在很大的挑戰(zhàn),難以被實(shí)際應(yīng)用。
(手語識(shí)別算法總體框架圖)
此次優(yōu)圖AI手語翻譯機(jī)產(chǎn)品,通過自研算法實(shí)現(xiàn)了對(duì)復(fù)雜手語表達(dá)的識(shí)別技術(shù)突破,參考了先進(jìn)的手勢(shì)識(shí)別、動(dòng)作識(shí)別和序列翻譯等技術(shù),考慮了手語的地域性和多樣性表達(dá),包含了不同的表達(dá)習(xí)慣和速度。
據(jù)介紹,優(yōu)圖AI手語翻譯機(jī)的數(shù)據(jù)集覆蓋了近千句日常表達(dá),900個(gè)常用詞匯,同時(shí)對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的分析和歸納,是最大的中文手語識(shí)別數(shù)據(jù)集。與此同時(shí),優(yōu)圖AI手語翻譯機(jī)能夠?qū)崿F(xiàn)整句的識(shí)別和翻譯,用戶表達(dá)的時(shí)候可以連貫將整個(gè)句子表達(dá)完。也不需要設(shè)定特定的結(jié)束或起始動(dòng)作,而是直接對(duì)用戶的動(dòng)作與否進(jìn)行判斷。
踐行科技向善,騰訊攜手無障礙協(xié)會(huì)攻堅(jiān)場(chǎng)景服務(wù)
“優(yōu)圖團(tuán)隊(duì)將繼續(xù)進(jìn)行語料庫拓展和算法優(yōu)化,進(jìn)一步探索在機(jī)場(chǎng)、民政等公共服務(wù)領(lǐng)域部署,提供無障礙溝通解決方案,方便聽障人日常交流提供便利。”騰訊杰出科學(xué)家賈佳亞教授表示。
為進(jìn)一步深入接觸聽障群體,了解手語和優(yōu)化數(shù)據(jù)和識(shí)別算法,目前騰訊優(yōu)圖實(shí)驗(yàn)室已和深圳市信息無障礙研究會(huì)成立AI手語識(shí)別聯(lián)合項(xiàng)目組,雙方將基于手語數(shù)據(jù)采集、產(chǎn)品算法優(yōu)化等展開長期深度的合作,通過與聽障者或手語使用者進(jìn)一步接觸,擴(kuò)充數(shù)據(jù)容量,完善數(shù)據(jù)規(guī)范,致力于推動(dòng)后續(xù)的產(chǎn)品和服務(wù)部署。
深圳市信息無障礙研究會(huì)秘書長楊曄表示,騰訊優(yōu)圖提供的這項(xiàng)技術(shù),可以在一定程度上緩解聽障者的溝通障礙,為聽障者提供更好的服務(wù)。
(優(yōu)圖和深圳信息無障礙研究會(huì)AI聽障無障礙聯(lián)合項(xiàng)目組)
實(shí)際上,這并不是騰訊在AI+無障礙建設(shè)上的首次嘗試,騰訊一直在堅(jiān)持推動(dòng)“一個(gè)都不能少”和“信息無障礙”理念的傳播與落地。從2009年起,騰訊在信息無障礙方面率展開探索,截至目前,旗下QQ、QQ空間、微信、騰訊網(wǎng)、騰訊新聞、應(yīng)用寶、企鵝FM等大部分產(chǎn)品已針對(duì)障礙用戶實(shí)現(xiàn)專門優(yōu)化。騰訊旗下各類產(chǎn)品從社交、娛樂、新聞等多維度出發(fā),共同努力,為障礙人士構(gòu)建友好的信息社會(huì)。2018年12月3日,獲得“聯(lián)合國教科文組織數(shù)字技術(shù)增強(qiáng)殘疾人權(quán)能獎(jiǎng)”。
根據(jù)世界衛(wèi)生組織的調(diào)查,全世界有超過十億人生活在因殘障引起的不便中,也就是說,地球上每七個(gè)人中就約有一人需要無障礙設(shè)施的幫助。為了讓更多的人關(guān)注到這群殘障人士,每年五月的第三個(gè)星期四也被設(shè)立為了全球無障礙宣傳日。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。