攬獲多項CES 2025科技大獎,蟬聯(lián)全球消費電子品牌TOP10國產(chǎn)動畫電影《哪吒之魔童鬧海》宣布全版本上映:支持IMAX、CINITY等多制式擎朗智能攜手科大訊飛,共啟具身智能服務(wù)機器人新征程“借機玩梗”?多家互聯(lián)網(wǎng)公司在小紅書發(fā)英文貼攬客OPPO Find X8 Ultra渲染圖曝光:外觀設(shè)計基本保持不變1月16日發(fā)布!真我14 Pro系列官宣:全球首款溫感變色手機三星Galaxy S25 Slim細節(jié)曝光:厚度僅6.5mm 對標(biāo)iPhone 17 Air斥資134億!TCL買下LG顯示廣州廠訊飛星火X1成為全國產(chǎn)算力平臺上唯一的深度推理大模型董明珠稱格力自研芯片設(shè)計制造封裝全鏈條完成微軟再次強調(diào)Win10將于10月14日終止支持,敦促用戶免費升級至Win11Arm曾考慮將授權(quán)價格提高300% 并曾探討設(shè)計自有芯片OpenAI推出新功能“Tasks” ChatGPT可變身成AI私人助理三星Galaxy S25系列手機AI創(chuàng)作新境界:語音/文字加持“草圖轉(zhuǎn)圖像”22mK!量子“冰箱”高效冷卻量子比特,助力量子計算騰飛比亞迪漢EV榮耀版汽車獲1.3.2 OTA升級,新增智能語音時控精靈等功能高通卷土重來再戰(zhàn)服務(wù)器芯片市場!Intel前Xeon首席架構(gòu)師加盟助陣首款防爆人形機器人“天魁 1 號”發(fā)布蘋果CarPlay 2.0新圖曝光:支持定制小組件上海AI實驗室書生·浦語大模型升級:僅用4T數(shù)據(jù)訓(xùn)練而成,通用模型首次融合常規(guī)對話與深度思考
  • 首頁 > 企業(yè)IT頻道 > 人工智能

    網(wǎng)易有道段亦濤:人工智能將顛覆機器翻譯領(lǐng)域

    2017年04月28日 17:29:26   來源:91科技

      2017GMIC(全球移動互聯(lián)網(wǎng)大會)未來創(chuàng)新峰會上,網(wǎng)易有道首席科學(xué)家段亦濤發(fā)表了《機器翻譯皆有道》的主題演講,分享了其在神經(jīng)網(wǎng)絡(luò)翻譯領(lǐng)域的研究,并表示該技術(shù)將在有道詞典、有道翻譯官、有道翻譯網(wǎng)頁版等產(chǎn)品上陸續(xù)上線,這意味著超7億有道用戶將便捷地享受到這一技術(shù)帶來的便利。段亦濤表示,神經(jīng)網(wǎng)絡(luò)翻譯是人工智能在翻譯領(lǐng)域的具體應(yīng)用,是目前最前沿的機器翻譯技術(shù),它帶來的翻譯質(zhì)量提升是過去十年的總和。

      以下是其演講原文(有刪減):

      大家好,很高興有機會在這里跟大家分享有道在機器翻譯方面做的一些探索。先簡單自我介紹,我是網(wǎng)易有道首席科學(xué)家,本科和碩士在北航學(xué)飛機設(shè)計專業(yè),博士在加州大學(xué)伯克利分校學(xué)計算機科學(xué)。之后我就加入了網(wǎng)易有道,目前主要關(guān)注機器學(xué)習(xí)領(lǐng)域,尤其是深度學(xué)習(xí)在機器翻譯、圖象識別、在線教育等方面的應(yīng)用。

      神經(jīng)網(wǎng)絡(luò)翻譯質(zhì)量提升 是過去十年總和

      有道其實很早就開始做機器翻譯,我們在2008年就推出了機器翻譯的服務(wù),應(yīng)該是國內(nèi)最早推出這一服務(wù)的互聯(lián)網(wǎng)公司。這兩年我們更關(guān)注把深度學(xué)習(xí)接入機器翻譯領(lǐng)域,我們研究成果是非常顯著的,我們的機器翻譯質(zhì)量有非常大的提升。

      我們先看兩個例子,給大家一個直觀的感受。第一個例子是英譯中的,我們隨便從外媒選取了一段新聞報道,報道內(nèi)容是關(guān)于前段時間巴黎恐怖事件。我們用各個翻譯引擎來進行了翻譯,第一個是統(tǒng)計翻譯模型,第二個是我們的神經(jīng)網(wǎng)絡(luò)翻譯模型,第三種是某海外的神經(jīng)網(wǎng)絡(luò)翻譯引擎。

      從上面的結(jié)果可以看出來,統(tǒng)計翻譯模型的結(jié)果拼湊感非常明顯,而且有些片斷翻譯還搞錯了,整體來看很不通順;有道的翻譯結(jié)果,可以看到是相當(dāng)?shù)臏?zhǔn)確和流暢的;第三個國外神經(jīng)網(wǎng)絡(luò)翻譯模型的結(jié)果,可以看到不少的不準(zhǔn)確的地方。

      我們再來看一個中譯英的例子,我們摘取了機器之心前段時間發(fā)布的一條消息。我們主要看看各家神經(jīng)網(wǎng)絡(luò)翻譯的結(jié)果,可以看到,有道上線的神經(jīng)網(wǎng)絡(luò)翻譯的結(jié)果,仍然是通順和準(zhǔn)確的,這里面幾乎沒有任何語法錯誤。這個結(jié)果,即使是普通人中等英文水平,都很難達到,但是我們的神經(jīng)網(wǎng)絡(luò)翻譯做到了。再來看另個國外神經(jīng)網(wǎng)絡(luò)模型的翻譯結(jié)果,其實還是看出有明顯的不合適的地方,比如“起起伏伏”以及一些詞之間的關(guān)系搞錯。

      也許有人會問,這些例子是不是精心挑選出來的。事實上,以上兩個例子只是我們隨機選出的兩個,沒有特別的篩選。我們對質(zhì)量的評測非常嚴(yán)格和客觀,我們采用龐大的評測數(shù)據(jù)集,并在這個數(shù)據(jù)集上看整體的質(zhì)量。大家可以下載有道翻譯官App直接體驗這個最新的翻譯結(jié)果。

      另外我們再看兩個數(shù)字,首先有道過去兩年研究神經(jīng)網(wǎng)絡(luò)翻譯所帶來的質(zhì)量提升差不多是過年十年質(zhì)量提升的總和,同時這個技術(shù)很快會被有道旗下的超過7億的用戶便捷地享受到。

      人工智能改變翻譯 更聰明更高效

      神經(jīng)網(wǎng)絡(luò)模型是一個很前沿的技術(shù),那它為什么能夠在機器翻譯領(lǐng)域能起到如此大的作用呢?實際上,神經(jīng)網(wǎng)絡(luò)模型模仿了人腦的工作機制,整個模型由大量的“神經(jīng)元”來構(gòu)成,一個“神經(jīng)元”完成一些簡單的任務(wù),然后通過對這些“神經(jīng)元”的組合來協(xié)調(diào)工作,最終得到更加出色的效果。

      而以前的統(tǒng)計翻譯模型更像一個機械系統(tǒng),它由很多個組件來構(gòu)成,包括短語組件、分詞組件、條序組件還有原模型等等。每個模塊都是有各自的功能和各自的目標(biāo),然后機械地拼裝在一起,完成一個翻譯的結(jié)果。和它相比,神經(jīng)網(wǎng)絡(luò)翻譯模型更像一個有機體,模型里面有很多參數(shù),這些參數(shù)都是為同一個目標(biāo)來調(diào)整和優(yōu)化的;它們中間的結(jié)合和交互更加有機,所以整體效果會更好。

      另一個不同是,兩種模型的內(nèi)部信息的表達方式也不一樣。在統(tǒng)計翻譯模型里,其表達方式能夠識別詞,但卻不能夠表達詞與詞之間的關(guān)系,比如兩個詞的詞義是相似還是相反的。而我們的神經(jīng)網(wǎng)絡(luò)翻譯模型,它使用一個十?dāng)?shù)位的向量來表達每個詞,它的表達能力更豐富、更靈活,以及能夠更好地來表達詞和詞之間的關(guān)系。比如說“計算機”和“電腦”這兩個詞,那么它們很可能在向量空間里離得很近。這種表達方式能夠顧及到更多這樣的關(guān)系,它的內(nèi)部表達是一個有機整體,從而生成更通順的翻譯結(jié)果。

      正如剛才所說,有道很早就開始研究機器翻譯領(lǐng)域,我們今天之所以在神經(jīng)網(wǎng)絡(luò)翻譯領(lǐng)域能夠獲得這樣的效果,有幾方面的原因。

      首先,有道在機器翻譯領(lǐng)域深耕了近十年,我們積累了大量的優(yōu)質(zhì)的語料和技術(shù)。我們依托有道詞典積累的語料和用戶數(shù)據(jù),能夠在英語學(xué)習(xí)這種翻譯場景下做到最好。其次,我們更加關(guān)注中文和其他外語之間的翻譯,所以火力更加集中,我們針對中文特有的語言現(xiàn)象做了非常多的優(yōu)化,包括中文的分詞等等。這些優(yōu)化都直接體現(xiàn)在最終的翻譯結(jié)果中。另外,我們集合網(wǎng)易公司的研發(fā)之力,和網(wǎng)易杭州研究院一起,攻克了數(shù)據(jù)處理、大規(guī)模框架、模型優(yōu)化、領(lǐng)域適配等技術(shù)難題,開發(fā)了一些我們特有的技術(shù),比如我們自己的領(lǐng)域適配技術(shù),使得我們的模型能夠自動識別不同場景。目前已經(jīng)在新聞、學(xué)習(xí)、口語和一些科技領(lǐng)域等場景下做到了最優(yōu)。”

      我們做的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù),目前可以很便捷讓用戶體驗到。比如用我們的翻譯引擎來做文本翻譯,翻譯效果比以前有了很大的提升;有道翻譯官的拍照翻譯,用戶只需要對文本進行拍照,就可實時展現(xiàn)出神經(jīng)網(wǎng)絡(luò)翻譯的結(jié)果。另外,我們?nèi)斯しg的團隊也開始全面使用有道上線的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù),推出了“有道人機翻譯”服務(wù):客戶提交訂單后,神經(jīng)網(wǎng)絡(luò)翻譯模型會先做一版初步翻譯,譯員們再在這個基礎(chǔ)上進一步調(diào)整,這就很大地提高了翻譯效率,同時翻譯費用降低了50%。

      有道翻譯官拍照翻譯中的應(yīng)用

      機器翻譯的未來 打破語言障礙

      回到問題的最初,我們?yōu)槭裁匆度脒@么巨大的人力物力財力,研究神經(jīng)網(wǎng)絡(luò)機器翻譯呢?

      最直接和現(xiàn)實的價值就是,神經(jīng)網(wǎng)絡(luò)翻譯能夠幫助人打破語言的障礙,使得信息的流通更加通常。縱觀歷史,信息交流的變革都是對人類技術(shù)進步有很強的刺激作用,往遠看有印刷術(shù)、造紙術(shù),近代有無線和有線電報等,以及到今天互聯(lián)網(wǎng)。雖然目前來看,信息技術(shù)的發(fā)展使得數(shù)據(jù)傳輸不再是瓶頸,但是另一個面臨的問題就是語言的障礙,比如數(shù)據(jù)傳過來沒有問題,但能不能看懂和理解就是另外回事。那么神經(jīng)網(wǎng)絡(luò)翻譯能夠幫助人們打破這個障礙,使人的交流更加通常,這個意義是非常重大的。

      同時,神經(jīng)網(wǎng)絡(luò)翻譯對整個人工智能領(lǐng)域有明顯的促進作用。語言和文字體系是人類特有的特性,所以如果我們沒有真正的理解語言的機制,那么就不可能說我們真正理解和做到人工智能。而在神經(jīng)網(wǎng)絡(luò)翻譯的研究過程中,既包括了對語言的理解,也包括了語言的生成,所以對它的研究能夠很好地促進人工智能整體發(fā)展。

      也正因為如此,有道以及網(wǎng)易公司將以神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)為契機,進一步探索人工智能與機器翻譯的結(jié)合,推動行業(yè)的技術(shù)創(chuàng)新和發(fā)展。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。