5月16日,全球無障礙宣傳日之際,騰訊優(yōu)圖實驗室宣布攻克AI手語識別技術(shù)挑戰(zhàn),聯(lián)合深圳市信息無障礙研究會發(fā)布“優(yōu)圖AI手語翻譯機(jī)”,致力于通過人工智能技術(shù)為聽障人群搭建無障礙溝通平臺。
據(jù)優(yōu)圖實驗室AI手語識別項目組研究員陽趙陽介紹,優(yōu)圖AI手語翻譯機(jī)以普通攝像頭作為手語采集裝置,依托高性能計算機(jī)進(jìn)行后臺運(yùn)算,用戶只需面對攝像頭完成手語表達(dá),翻譯機(jī)屏幕界面就能快速把手語轉(zhuǎn)換為文字,幫助聽障人士和普通人進(jìn)行正常交流,未來有望在機(jī)場、高鐵、民政窗口等公共場所部署應(yīng)用,助力信息無障礙城市建設(shè)。
這也是繼本月初優(yōu)圖實驗室宣布通過人工智能技術(shù)幫助警方尋回多名被拐超過10年兒童之后,騰訊踐行“科技向善”理念的又一體現(xiàn),也是騰訊在計算機(jī)視覺人工智能領(lǐng)域的又一重大技術(shù)突破。
(優(yōu)圖AI手語翻譯機(jī)界面)
攻克手語識別難題,自研算法解決溝通障礙
據(jù)世界衛(wèi)生組織最新數(shù)據(jù)顯示,目前全球約有4.66億人患有殘疾性聽力損失,超過全世界人口的5%;據(jù)估計,到2050年這一數(shù)字將達(dá)到9億,全球?qū)⒂屑s十分之一的人出現(xiàn)殘疾性聽力損失。據(jù)北京聽力協(xié)會2017年預(yù)估數(shù)據(jù),國內(nèi)殘疾性聽力障礙人士已達(dá)7200萬。
雖然我國在信息無障礙領(lǐng)域的投入在逐漸增加,但聽障人群的一些需求仍得不到滿足,尤其在公共環(huán)境設(shè)施、服務(wù)體驗等方面。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計,我國目前致力于聽障者專業(yè)服務(wù)的人士只有大約一萬名,大部分公共服務(wù)并沒有配備專門的便利設(shè)施,這些都是聽障者長久以來面臨的迫切需求。
針對這一社會痛點(diǎn),優(yōu)圖團(tuán)隊首次將計算機(jī)視覺人工智能技術(shù)應(yīng)用到手語識別場景,而此次發(fā)布的“優(yōu)圖AI手語翻譯機(jī)”產(chǎn)品,通過一臺搭載高性能計算機(jī)的終端,可以識別聽障人士的手語,并快速識別翻譯成文字。
據(jù)騰訊優(yōu)圖研究員陽趙陽介紹,手語翻譯的核心技術(shù)是手語識別(SLR),通過計算機(jī)算法,自動區(qū)分手語表達(dá)中的各類手勢、動作、手勢和動作之間的切換,最后將手語翻譯成為文字。此前也有一些團(tuán)隊探索人工智能技術(shù)在聽障無障礙方面的技術(shù)探索,但往往需要借助于一些額外的設(shè)備或傳感器,不僅增加了使用門檻并且無法對復(fù)雜手語表達(dá)的識別率。但受限于手語特有的地域性、復(fù)雜性和多樣性,使得這些手語識別研究即使在深度學(xué)習(xí)的幫助下也依然存在很大的挑戰(zhàn),難以被實際應(yīng)用。
(手語識別算法總體框架圖)
此次優(yōu)圖AI手語翻譯機(jī)產(chǎn)品,通過自研算法實現(xiàn)了對復(fù)雜手語表達(dá)的識別技術(shù)突破,參考了先進(jìn)的手勢識別、動作識別和序列翻譯等技術(shù),考慮了手語的地域性和多樣性表達(dá),包含了不同的表達(dá)習(xí)慣和速度。
據(jù)介紹,優(yōu)圖AI手語翻譯機(jī)的數(shù)據(jù)集覆蓋了近千句日常表達(dá),900個常用詞匯,同時對數(shù)據(jù)進(jìn)行進(jìn)一步的分析和歸納,是最大的中文手語識別數(shù)據(jù)集。與此同時,優(yōu)圖AI手語翻譯機(jī)能夠?qū)崿F(xiàn)整句的識別和翻譯,用戶表達(dá)的時候可以連貫將整個句子表達(dá)完。也不需要設(shè)定特定的結(jié)束或起始動作,而是直接對用戶的動作與否進(jìn)行判斷。
踐行科技向善,騰訊攜手無障礙協(xié)會攻堅場景服務(wù)
“優(yōu)圖團(tuán)隊將繼續(xù)進(jìn)行語料庫拓展和算法優(yōu)化,進(jìn)一步探索在機(jī)場、民政等公共服務(wù)領(lǐng)域部署,提供無障礙溝通解決方案,方便聽障人日常交流提供便利。”騰訊杰出科學(xué)家賈佳亞教授表示。
為進(jìn)一步深入接觸聽障群體,了解手語和優(yōu)化數(shù)據(jù)和識別算法,目前騰訊優(yōu)圖實驗室已和深圳市信息無障礙研究會成立AI手語識別聯(lián)合項目組,雙方將基于手語數(shù)據(jù)采集、產(chǎn)品算法優(yōu)化等展開長期深度的合作,通過與聽障者或手語使用者進(jìn)一步接觸,擴(kuò)充數(shù)據(jù)容量,完善數(shù)據(jù)規(guī)范,致力于推動后續(xù)的產(chǎn)品和服務(wù)部署。
深圳市信息無障礙研究會秘書長楊曄表示,騰訊優(yōu)圖提供的這項技術(shù),可以在一定程度上緩解聽障者的溝通障礙,為聽障者提供更好的服務(wù)。
(優(yōu)圖和深圳信息無障礙研究會AI聽障無障礙聯(lián)合項目組)
實際上,這并不是騰訊在AI+無障礙建設(shè)上的首次嘗試,騰訊一直在堅持推動“一個都不能少”和“信息無障礙”理念的傳播與落地。從2009年起,騰訊在信息無障礙方面率展開探索,截至目前,旗下QQ、QQ空間、微信、騰訊網(wǎng)、騰訊新聞、應(yīng)用寶、企鵝FM等大部分產(chǎn)品已針對障礙用戶實現(xiàn)專門優(yōu)化。騰訊旗下各類產(chǎn)品從社交、娛樂、新聞等多維度出發(fā),共同努力,為障礙人士構(gòu)建友好的信息社會。2018年12月3日,獲得“聯(lián)合國教科文組織數(shù)字技術(shù)增強(qiáng)殘疾人權(quán)能獎”。
根據(jù)世界衛(wèi)生組織的調(diào)查,全世界有超過十億人生活在因殘障引起的不便中,也就是說,地球上每七個人中就約有一人需要無障礙設(shè)施的幫助。為了讓更多的人關(guān)注到這群殘障人士,每年五月的第三個星期四也被設(shè)立為了全球無障礙宣傳日。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。
近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。