合合信息:破解大模型語料庫難題的引領(lǐng)者核聚變2024北京站高能開幕,ROG電競(jìng)顯示器強(qiáng)勢(shì)助力游戲狂歡華為企業(yè)客戶支持圓桌會(huì)議成功舉辦,共筑ICT基礎(chǔ)設(shè)施維護(hù)新未來66元搶爆款A(yù)R眼鏡!京東AR眼鏡超級(jí)新品日30天無憂適用等你來攜手共進(jìn),智啟未來 —— 華為與CypressTel賽柏特成立 SD-WAN 聯(lián)合創(chuàng)新實(shí)驗(yàn)合合信息成功IPO開啟新篇章全球首款第二代酷睿Ultra處理器筆記本!聯(lián)想YOGA Air 15 Aura AI元啟版開啟預(yù)售中國(guó)品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國(guó) 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%
  • 首頁 > 云計(jì)算頻道 > 大模型

    UltraFastBERT:推理過程僅用0.3%神經(jīng)元,性能與類似的BERT模型相當(dāng)

    2023年11月28日 11:51:13   來源:站長(zhǎng)之家

      近日,ETH Zurich的研究人員成功推出了一項(xiàng)創(chuàng)新性的技術(shù)——UltraFastBERT,該技術(shù)通過在推理過程中僅使用0.3%的神經(jīng)元,實(shí)現(xiàn)了與其他類似BERT模型相當(dāng)?shù)男阅芩。這一創(chuàng)新主要通過引入快速前饋網(wǎng)絡(luò)(FFFs)來解決在推理過程中減少神經(jīng)元數(shù)量的問題,相較于基準(zhǔn)實(shí)現(xiàn),取得了顯著的速度提升。

      研究人員提供了代碼、基準(zhǔn)設(shè)置以及模型權(quán)重,支持了這一方法的有效性。他們建議進(jìn)一步探索通過混合稀疏張量和設(shè)備特定優(yōu)化,以及在大型語言模型中應(yīng)用多個(gè)FFF樹的潛在性能提升。

      UltraFastBERT在推理過程中展現(xiàn)了高效的語言建模,通過將傳統(tǒng)模型的前饋網(wǎng)絡(luò)替換為簡(jiǎn)化的FFFs,使用一致的激活函數(shù)和所有節(jié)點(diǎn)輸出權(quán)重,同時(shí)消除了偏差。多個(gè)FFF樹協(xié)同計(jì)算中間層輸出,允許多樣化的架構(gòu)。所提供的高水平CPU和PyTorch實(shí)現(xiàn)顯著提升了速度,而研究還探討了通過多個(gè)FFF樹和替換大型語言模型前饋網(wǎng)絡(luò)為FFFs,實(shí)現(xiàn)潛在加速的可能性。為設(shè)備特定優(yōu)化,建議使用Intel MKL和NVIDIA cuBLAS。

      UltraFastBERT不僅在推理中僅使用0.3%的神經(jīng)元的情況下實(shí)現(xiàn)了與BERT-base相當(dāng)?shù)男阅,而且在僅使用單個(gè)GPU進(jìn)行一天訓(xùn)練的情況下,仍保持至少96.0%的GLUE預(yù)測(cè)性能。研究還展示了通過快速前饋層實(shí)現(xiàn)顯著的速度提升,達(dá)到48倍到78倍的CPU上的即時(shí)推理速度提升,以及GPU上的3.15倍速度提升,表明在替換大型模型方面存在潛在可能性。

      總體而言,UltraFastBERT是對(duì)BERT的修改,實(shí)現(xiàn)了在推理過程中僅使用少量神經(jīng)元的高效語言建模。該模型通過FFFs實(shí)現(xiàn)了顯著的速度提升,提供的CPU和PyTorch實(shí)現(xiàn)分別實(shí)現(xiàn)了78倍和40倍的速度提升。研究建議通過實(shí)現(xiàn)有條件神經(jīng)執(zhí)行的基元,進(jìn)一步加速語言建模。盡管僅使用0.3%的神經(jīng)元,UltraFastBERT的最佳模型與BERT-base的性能相當(dāng),展示了高效語言建模的潛力。UltraFastBERT展示了高效語言建模的潛在進(jìn)展,為未來更快、資源友好的模型鋪平了道路。

      未來研究的建議包括使用混合向量級(jí)稀疏張量和設(shè)備特定優(yōu)化實(shí)現(xiàn)高效的FFF推理,探索有條件神經(jīng)執(zhí)行加速語言建模的全部潛力,以及通過將前饋網(wǎng)絡(luò)替換為FFFs優(yōu)化大型語言模型的潛在性。未來的工作可能著重于在流行框架如PyTorch或TensorFlow中實(shí)現(xiàn)可重現(xiàn)的模型,并進(jìn)行廣泛的基準(zhǔn)測(cè)試,以評(píng)估UltraFastBERT及類似高效語言模型的性能和實(shí)際影響。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。