66元搶爆款A(yù)R眼鏡!京東AR眼鏡超級(jí)新品日30天無憂適用等你來攜手共進(jìn),智啟未來 —— 華為與CypressTel賽柏特成立 SD-WAN 聯(lián)合創(chuàng)新實(shí)驗(yàn)合合信息成功IPO開啟新篇章全球首款第二代酷睿Ultra處理器筆記本!聯(lián)想YOGA Air 15 Aura AI元啟版開啟預(yù)售中國品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴
  • 首頁 > 延展閱讀 > 2017歸檔

    網(wǎng)易有道上線神經(jīng)網(wǎng)絡(luò)翻譯 質(zhì)量提升超過去十年總和

    2017年04月28日 18:01:25   來源:中文科技資訊

      在機(jī)器翻譯領(lǐng)域深耕了近十年的網(wǎng)易有道,再次給人們帶來了驚喜。

      近日,網(wǎng)易有道在GMIC(全球移動(dòng)互聯(lián)網(wǎng)大會(huì))未來創(chuàng)新峰會(huì)上公布:由網(wǎng)易公司自主研發(fā)的神經(jīng)網(wǎng)絡(luò)翻譯( Neural Machine Translation,以下簡稱NMT)技術(shù)正式上線。作為受到丁磊親自“過問”、網(wǎng)易最重要技術(shù)創(chuàng)新之一,此次在有道上線的NMT技術(shù),由網(wǎng)易有道與網(wǎng)易杭州研究院歷時(shí)兩年合力研發(fā),將服務(wù)于有道詞典、有道翻譯官、有道翻譯網(wǎng)頁版、有道e讀等產(chǎn)品;這不但意味著借力于NMT技術(shù),有道產(chǎn)品在語言翻譯質(zhì)量方面將有巨大的提升——超過7億用戶將享受到NMT帶來的高效與便利,更意味著低調(diào)務(wù)實(shí)的網(wǎng)易,早已在人工智能的領(lǐng)域未雨綢繆,并早于業(yè)界實(shí)現(xiàn)人工智能技術(shù)在更廣泛網(wǎng)民中的深度使用。

      人工智能改變翻譯翻譯更“聰明

      深度學(xué)習(xí)是推動(dòng)當(dāng)前人工智能熱潮最關(guān)鍵的技術(shù),它首先在圖像、音頻等感知領(lǐng)域獲得了巨大成功,目前在語言方面的應(yīng)用也獲得了長足的進(jìn)展。

      而神經(jīng)網(wǎng)絡(luò)翻譯就是深度學(xué)習(xí)在機(jī)器翻譯領(lǐng)域的具體應(yīng)用。

      作為目前機(jī)器翻譯領(lǐng)域最前沿的技術(shù),神經(jīng)網(wǎng)絡(luò)翻譯采用獨(dú)到的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),能夠?qū)Ψg的全過程整體建模;與統(tǒng)計(jì)翻譯模型(SMT)相比,神經(jīng)網(wǎng)絡(luò)翻譯模型更像一個(gè)有機(jī)體。

      NMT對(duì)整個(gè)句子進(jìn)行編碼,能夠更充分地利用上下文信息,判定多義詞的詞義,生成更高質(zhì)量的譯文。最直觀的一點(diǎn)就是,NMT譯文的句子結(jié)構(gòu)完整,語序更接近人類語言使用習(xí)慣,翻譯結(jié)果更加通順;而SMT則像由多個(gè)組件構(gòu)成的機(jī)器,每個(gè)組件完成各自的目標(biāo),但“拼接”出來的翻譯結(jié)果,常常差強(qiáng)人意。

      NMT翻譯原理

      如果從具體的例子來看,此次在有道上線的NMT的翻譯結(jié)果更準(zhǔn)確,斷句和語法比起傳統(tǒng)機(jī)器翻譯(SMT)有了直觀可感知的提升,更接近人們心中“會(huì)說話”的人工智能。

      NMT與SMT 英譯中結(jié)果對(duì)比

      據(jù)悉,與傳統(tǒng)的基于短語的統(tǒng)計(jì)翻譯模型相比,此次在有道上線的NMT翻譯質(zhì)量的提升是SMT過去十年累計(jì)提升的總和。

      新聞和口語翻譯出色  BLEU值超同行

      從翻譯界通用的BLEU值評(píng)價(jià)指標(biāo)來看,此次在有道上線的NMT在新聞文章、英語學(xué)習(xí)及口語等場景下的英文翻譯,做得比同類國際產(chǎn)品更加出色。而丁磊也曾在內(nèi)部表示,新聞和口語是中國人接觸英語最常見的兩個(gè)領(lǐng)域,應(yīng)在這兩方面加大研究。

      事實(shí)上,詞典本就是有道的傳統(tǒng)優(yōu)勢(shì),其詞條數(shù)據(jù)龐大、解釋準(zhǔn)確,已經(jīng)成為國內(nèi)用戶學(xué)習(xí)英語的首選。憑借這一優(yōu)勢(shì),再加上有針對(duì)性的優(yōu)化,此次在有道上線的NMT對(duì)英語學(xué)習(xí)場景下的翻譯結(jié)果更加精準(zhǔn)。這類翻譯需求的特點(diǎn)是,原文規(guī)整、語法及句式較為規(guī)范,因此用戶對(duì)其準(zhǔn)確性要求更高。在該類數(shù)據(jù)上的盲測(cè)結(jié)果顯示,此次在有道上線的NMT,其英譯中和中譯英的BLEU值均領(lǐng)先同行7個(gè)多百分點(diǎn)。

      英譯中對(duì)比

      新聞文章翻譯是另外一個(gè)常見的需求,它的特點(diǎn)是,長句較多、句子結(jié)構(gòu)復(fù)雜且有大量人名地名。在這類數(shù)據(jù)上,此次在有道上線的NMT同樣表現(xiàn)不俗,英譯中BLEU值超同行6個(gè)百分點(diǎn),而中譯英也超其8個(gè)百分點(diǎn)。

      中譯英對(duì)比

      網(wǎng)易公司之力攻堅(jiān)技術(shù)難題

      此次在有道上線的NMT,其翻譯質(zhì)量的大幅提升,源于有道及網(wǎng)易杭州研究院的強(qiáng)大技術(shù)支持。

      作為國內(nèi)最早開發(fā)統(tǒng)計(jì)機(jī)器翻譯(SMT)的公司,網(wǎng)易早在兩年前也開始涉足神經(jīng)網(wǎng)絡(luò)翻譯領(lǐng)域的探索,并為此投入了巨大的研發(fā)力量。

      網(wǎng)易有道首席科學(xué)家段亦濤表示,“有道在用戶翻譯場景上近十年的積累,使得我們擁有豐富的數(shù)據(jù)資源,同時(shí)我們攻克了數(shù)據(jù)處理、領(lǐng)域適配等技術(shù)難題,并開發(fā)出一些我們特有的技術(shù),比如領(lǐng)域適配技術(shù),使我們的模型能夠自動(dòng)適應(yīng)不同的場景,目前已經(jīng)在新聞、學(xué)習(xí)、口語和一些科技領(lǐng)域等場景下做到了最優(yōu)。”

      網(wǎng)易杭州研究院感知與智能中心總經(jīng)理李曉燕則表示,“此次在有道中上線NMT 技術(shù),可以說是機(jī)器翻譯領(lǐng)域的標(biāo)桿,作為擁有十余年技術(shù)沉淀的互聯(lián)網(wǎng)實(shí)力研發(fā)團(tuán)隊(duì),杭研院從深度學(xué)習(xí)理論出發(fā),解決了大規(guī)?蚣、模型優(yōu)化等技術(shù)難題,高效完成了翻譯場景對(duì)接和NMT技術(shù)應(yīng)用工程化。”

      機(jī)器翻譯的未來語言不再是障礙

      此次在有道上線的NMT把人工智能接入機(jī)器翻譯,并結(jié)合自身優(yōu)勢(shì)以及對(duì)技術(shù)的優(yōu)化從而大幅提升翻譯質(zhì)量,對(duì)有道乃至整個(gè)翻譯行業(yè)來說,都是一次重要突破。

      過去由于技術(shù)的限制,機(jī)器翻譯僅能翻譯一些簡單詞組,對(duì)復(fù)雜內(nèi)容翻譯效果并不佳。而神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)的發(fā)展,給翻譯質(zhì)量帶來了極大提升,高質(zhì)量的機(jī)器翻譯將更廣泛更便捷地被人們使用,那么語言對(duì)于人類來說,還將是一個(gè)障礙么?

      段亦濤坦言,神經(jīng)網(wǎng)絡(luò)翻譯在全球范圍內(nèi)都屬于前沿技術(shù),雖然業(yè)內(nèi)已有一定成果,但可挖掘的空間還很大。目前我們的技術(shù)突破,的確讓業(yè)內(nèi)感到振奮,但機(jī)器翻譯作為人工智能領(lǐng)域的核心難題之一,未來還有很多的努力要做。

      李曉燕也談到,今天我們?cè)谟械喇a(chǎn)品中上線的NMT,只是人工智能在機(jī)器翻譯領(lǐng)域探索的起點(diǎn)。得益于有道在翻譯數(shù)據(jù)的強(qiáng)大積累,我們的NMT技術(shù)將快速迭代更新,未來將不斷帶來更優(yōu)質(zhì)的翻譯體驗(yàn)。

      據(jù)悉,此次推出的NMT技術(shù)未來兩周將陸續(xù)在有道詞典、有道翻譯官、有道翻譯網(wǎng)頁版、有道e讀等產(chǎn)品中正式應(yīng)用。

      有道翻譯官拍照翻譯中應(yīng)用

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    [編號(hào): ]
    分享到微信

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。