中國(guó)品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書(shū)本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國(guó) 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬(wàn)輛,到 2027 年建成萬(wàn)億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚(yú)相關(guān)搜索量暴漲384%2024 vivo開(kāi)發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來(lái)了,阿里云「通義靈碼」全面進(jìn)化,全流程開(kāi)發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來(lái)了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性
  • 首頁(yè) > 即時(shí)新聞

    科大訊飛摘得ICFHR 2020數(shù)學(xué)公式識(shí)別挑戰(zhàn)賽冠軍

    2020年06月17日 11:14:53   來(lái)源:中文科技資訊

      提起科大訊飛,人們總津津樂(lè)道于“讓機(jī)器能聽(tīng)會(huì)說(shuō)”的先進(jìn)智能語(yǔ)音技術(shù)。其實(shí)除此之外,科大訊飛的“攻城獅們”也一直致力于讓機(jī)器“能看會(huì)認(rèn)”。

      近日,科大訊飛A.I.研究院聯(lián)合中科大語(yǔ)音及語(yǔ)言信息處理國(guó)家工程實(shí)驗(yàn)室,以顯著優(yōu)勢(shì)獲得ICFHR 2020 OffRaSHME數(shù)學(xué)公式識(shí)別挑戰(zhàn)賽冠軍。這是科大訊飛繼ICPR 2018 MTWI圖文識(shí)別挑戰(zhàn)賽上獲得三項(xiàng)冠軍、ICDAR 2019 CROHME數(shù)學(xué)公式識(shí)別挑戰(zhàn)賽上獲得兩項(xiàng)冠軍后,在復(fù)雜版面文檔圖像識(shí)別理解方向上所取得的又一佳績(jī),再次展現(xiàn)科大訊飛在相關(guān)領(lǐng)域的技術(shù)先進(jìn)性。

      離線手寫數(shù)學(xué)公式識(shí)別(官方數(shù)據(jù))榜單

      離線手寫數(shù)學(xué)公式識(shí)別(外源數(shù)據(jù))榜單

      備注:“Correct”表示公式識(shí)別的句正確率,“”和分別表示整條公式中允許出現(xiàn)1處和2處錯(cuò)誤的識(shí)別的句正確率

      技術(shù)頂天,掌握?qǐng)D文識(shí)別“金字塔”級(jí)別難題“解法”

      此次OffRaSHME(Offline Recognition and Spotting of Handwritten Mathematical Expressions)數(shù)學(xué)公式識(shí)別挑戰(zhàn)賽由ICFHR 2020(International Conference on Frontiers of Handwriting Recognition)舉辦,參賽隊(duì)伍包括韓國(guó)三星、東京農(nóng)工大學(xué)、華南理工大學(xué)、中山大學(xué)等多家常年深耕文檔分析理解領(lǐng)域的研究機(jī)構(gòu)。

      相比于常規(guī)的圖文識(shí)別,對(duì)數(shù)學(xué)公式的識(shí)別難度和技術(shù)挑戰(zhàn)往往更高。本次OffRaSHME官方比賽任務(wù)為“離線手寫數(shù)學(xué)公式識(shí)別”,該任務(wù)相比ICDAR 2019 CROHME的離線手寫公式識(shí)別任務(wù),難度再度升級(jí),有以下三大難點(diǎn):

      公式結(jié)構(gòu)復(fù)雜,尤其是各種結(jié)構(gòu)的嵌套

      難以辨別的形近字符Xx,Z2r

      本次比賽添加了很多非常規(guī)符號(hào)的組合,容易和公式混淆

      難度雖高,但這樣的任務(wù)對(duì)于科大訊飛來(lái)說(shuō)并不算陌生。

      基于在手寫數(shù)學(xué)公式識(shí)別領(lǐng)域深耕多年的技術(shù)積累,科大訊飛從基于上下文無(wú)關(guān)文法的傳統(tǒng)數(shù)學(xué)公式方法到創(chuàng)新性地提出基于LaTeX建模的Encoder-Decoder識(shí)別算法,其中,LaTeX作為最常用的數(shù)學(xué)公式表達(dá)之一,研究人員將數(shù)學(xué)公式識(shí)別問(wèn)題看作圖像到LaTeX序列的翻譯問(wèn)題,借助注意力機(jī)制實(shí)現(xiàn)更精準(zhǔn)的端到端識(shí)別能力,該方案在2019 CROHME中一舉打敗了常年占據(jù)CROHME冠軍地位的MyScript。

      而針對(duì)數(shù)學(xué)公式識(shí)別中最難的復(fù)雜結(jié)構(gòu)嵌套問(wèn)題,科大訊飛提出了基于樹(shù)形結(jié)構(gòu)信息建模的Encoder-Decoder識(shí)別算法,這種算法在復(fù)雜公式結(jié)構(gòu)嵌套上更具泛化能力。針對(duì)形近符號(hào)區(qū)分難度大的問(wèn)題,科大訊飛提出使用基于LaTeX語(yǔ)言模型的數(shù)據(jù)增強(qiáng)策略,利用數(shù)學(xué)公式的樹(shù)形結(jié)構(gòu)表達(dá),合理地拆分分解數(shù)學(xué)公式,并利用這些公式訓(xùn)練LaTeX語(yǔ)言模型,最后使用語(yǔ)言模型增強(qiáng)出合理的、符合上下文語(yǔ)義關(guān)聯(lián)的數(shù)據(jù),該策略可以很大程度上緩解形近符號(hào)識(shí)別困難的問(wèn)題。

      通過(guò)以上多項(xiàng)技術(shù)能力的綜合運(yùn)用,此次科大訊飛以顯著優(yōu)勢(shì)拿下了此次任務(wù)難度極高的數(shù)學(xué)公式識(shí)別挑戰(zhàn)賽冠軍,證明了其在數(shù)學(xué)公式識(shí)別領(lǐng)域的技術(shù)先進(jìn)性;在實(shí)際應(yīng)用中,學(xué)生作業(yè)試卷文檔存在版面結(jié)構(gòu)復(fù)雜、書(shū)寫風(fēng)格差異顯著等難點(diǎn)問(wèn)題,這一系統(tǒng)將為其提供更為豐富有效的解決方案。

      通過(guò)多項(xiàng)技術(shù)能力的綜合運(yùn)用,在“能看會(huì)認(rèn)”上,科大訊飛做得更好了!不僅能識(shí)別更復(fù)雜的數(shù)學(xué)公式,還能做到“中文+數(shù)學(xué)公式”混合搭配的內(nèi)容識(shí)別,此后將在更多A.I.產(chǎn)品中應(yīng)用。

      https://v.qq.com/x/page/s3080uld0xk.html

      應(yīng)用立地,打造“能看會(huì)認(rèn)”的A.I.產(chǎn)品

      在數(shù)學(xué)公式識(shí)別比賽之外,近期科大訊飛還在另一項(xiàng)自然場(chǎng)景的文字檢測(cè)分割識(shí)別的相關(guān)技術(shù)成果在ICDAR ReCTS(Reading Challenge on Reading Chinese Text on Signboard)評(píng)測(cè)任務(wù)取得顯著突破,刷新單字識(shí)別、文本行識(shí)別、文本行檢測(cè)和端到端識(shí)別全部四項(xiàng)榜單世界記錄,使得系統(tǒng)在解決復(fù)雜場(chǎng)景下文字檢測(cè)和識(shí)別的難題中更為游刃有余。

      這些成績(jī)并非一簇而就。

      事實(shí)上,科大訊飛在圖文識(shí)別領(lǐng)域已有多年核心技術(shù)積累,擁有自主知識(shí)產(chǎn)權(quán),并伴隨著每次技術(shù)迭代,產(chǎn)品都迎來(lái)大規(guī)模更新升級(jí),更好滿足用戶在多個(gè)場(chǎng)景下使用需求。

      2015年,輕量級(jí)的卷積神經(jīng)網(wǎng)絡(luò)首次在手機(jī)設(shè)備上使用,使得在線手寫字符識(shí)別任務(wù)上取得突破性進(jìn)展。依托此項(xiàng)技術(shù),訊飛輸入法用戶手寫輸入體驗(yàn)感顯著提升。

      2016年,CNN-HMM框架在文本行識(shí)別任務(wù)中得到成功應(yīng)用,該套系統(tǒng)無(wú)需進(jìn)行文本行切分等規(guī)則化的復(fù)雜版面分析,有效避免切分帶來(lái)的錯(cuò)誤,使得篇章級(jí)的中、英文手寫文檔識(shí)別效果達(dá)到人工相當(dāng)水平。依托此項(xiàng)技術(shù),科大訊飛智能輔助評(píng)卷系統(tǒng)能夠?qū)φZ(yǔ)文作文、英語(yǔ)作文、英語(yǔ)翻譯、數(shù)學(xué)填空、英語(yǔ)填空等題型進(jìn)行輔助評(píng)卷,應(yīng)用全國(guó)多省市的中高考,累計(jì)處理題卡數(shù)量過(guò)億張。

      2018年,基于注意力機(jī)制的Encoder-Decoder模型在自然場(chǎng)景文字識(shí)別任務(wù)上大放異彩,融合語(yǔ)言模型進(jìn)行端到端訓(xùn)練,使得拍照模糊的文字也能通過(guò)語(yǔ)言模型“聯(lián)想”而被正確識(shí)別。依托此項(xiàng)技術(shù),在訊飛翻譯機(jī)中,對(duì)復(fù)雜場(chǎng)景下的多種字體也能一拍即譯,讓拍照翻譯更清晰更準(zhǔn)確,能夠滿足更多消費(fèi)者在國(guó)外旅游、購(gòu)物的場(chǎng)景應(yīng)用需求。

      今年,在數(shù)學(xué)公式識(shí)別任務(wù)的諸多關(guān)鍵技術(shù)上繼續(xù)突破,相關(guān)核心技術(shù)也將應(yīng)用在訊飛智能學(xué)習(xí)機(jī)等產(chǎn)品中,幫助用戶精確地進(jìn)行大數(shù)據(jù)學(xué)情分析,找到知識(shí)點(diǎn)的薄弱項(xiàng),實(shí)現(xiàn)“個(gè)性化精準(zhǔn)學(xué)”,幫助廣大同學(xué)提升學(xué)習(xí)效率、鞏固學(xué)習(xí)效果。

      在技術(shù)應(yīng)用的過(guò)程中,手寫圖文識(shí)別也與智能語(yǔ)音等關(guān)鍵技術(shù)深度融合,讓大家切實(shí)感受到技術(shù)進(jìn)步帶來(lái)的高效、便利性。如“出口成章,躍然紙上”的訊飛智能辦公本,可以實(shí)現(xiàn)語(yǔ)音直接搜索手寫筆記內(nèi)容,“一句話找到手寫筆記”,滿足用戶在更多筆記場(chǎng)景下的記錄、寫作、搜索、多端同步需求,有效提高辦公效率。

      在即將到來(lái)的618年中大促中,還有更多產(chǎn)品將和大家見(jiàn)面,大家可以進(jìn)一步、零距離體驗(yàn)這些新技術(shù)。

      堅(jiān)守人工智能道路21年,科大訊飛不斷攀越技術(shù)高峰,在智能語(yǔ)音、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解等技術(shù)領(lǐng)域摘得一項(xiàng)又一項(xiàng)桂冠,但這并不是終點(diǎn)?拼笥嶏w將始終秉承“頂天立地”的技術(shù)信仰,打造一件件“能聽(tīng)會(huì)說(shuō)”、“能看會(huì)認(rèn)”、“能理解會(huì)思考”的人工智能產(chǎn)品,用人工智能點(diǎn)亮人間煙火。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    [No. S073]
    分享到微信

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。