核聚變2024北京站高能開(kāi)幕,ROG電競(jìng)顯示器強(qiáng)勢(shì)助力游戲狂歡華為企業(yè)客戶支持圓桌會(huì)議成功舉辦,共筑ICT基礎(chǔ)設(shè)施維護(hù)新未來(lái)66元搶爆款A(yù)R眼鏡!京東AR眼鏡超級(jí)新品日30天無(wú)憂適用等你來(lái)攜手共進(jìn),智啟未來(lái) —— 華為與CypressTel賽柏特成立 SD-WAN 聯(lián)合創(chuàng)新實(shí)驗(yàn)合合信息成功IPO開(kāi)啟新篇章全球首款第二代酷睿Ultra處理器筆記本!聯(lián)想YOGA Air 15 Aura AI元啟版開(kāi)啟預(yù)售中國(guó)品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書(shū)本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國(guó) 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫(huà)像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬(wàn)輛,到 2027 年建成萬(wàn)億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋(píng)果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚(yú)相關(guān)搜索量暴漲384%2024 vivo開(kāi)發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來(lái)了,阿里云「通義靈碼」全面進(jìn)化,全流程開(kāi)發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來(lái)了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%
  • 首頁(yè) > 企業(yè)IT頻道 > 人工智能

    簡(jiǎn)述機(jī)器學(xué)習(xí)加速器的五種類型

    2022年12月14日 11:42:35   來(lái)源:51CTO

      譯者 | 布加迪

      過(guò)去十年是深度學(xué)習(xí)的時(shí)代。我們?yōu)閺腁lphaGo到DELL-E 2的一系列重大事件而激動(dòng)不已。日常生活中出現(xiàn)了不計(jì)其數(shù)的由人工智能(AI)驅(qū)動(dòng)的產(chǎn)品或服務(wù),包括Alexa設(shè)備、廣告推薦、倉(cāng)庫(kù)機(jī)器人和自動(dòng)駕駛汽車等。

      近年來(lái),深度學(xué)習(xí)模型的規(guī)模呈指數(shù)級(jí)增長(zhǎng)。這不是什么新聞了:Wu Dao 2.0模型含有1.75萬(wàn)億參數(shù),在SageMaker訓(xùn)練平臺(tái)的240個(gè)ml.p4d.24xlarge實(shí)例上訓(xùn)練GPT-3大約只需25天。

      但隨著深度學(xué)習(xí)訓(xùn)練和部署的發(fā)展,它變得越來(lái)越具有挑戰(zhàn)性。由于深度學(xué)習(xí)模型的發(fā)展,可擴(kuò)展性和效率是訓(xùn)練和部署面臨的兩大挑戰(zhàn)。

      本文將總結(jié)機(jī)器學(xué)習(xí)(ML)加速器的五大類型。

      了解AI工程中的ML生命周期

      在全面介紹ML加速器之前,不妨先看看ML生命周期。

      ML生命周期是數(shù)據(jù)和模型的生命周期。數(shù)據(jù)可謂是ML的根源,決定著模型的質(zhì)量。生命周期中的每個(gè)方面都有機(jī)會(huì)加速。

      MLOps可以使ML模型部署的過(guò)程實(shí)現(xiàn)自動(dòng)化。但由于操作性質(zhì),它局限于AI工作流的橫向過(guò)程,無(wú)法從根本上改善訓(xùn)練和部署。

      AI工程遠(yuǎn)超MLOps的范疇,它可以整體(橫向和縱向)設(shè)計(jì)機(jī)器學(xué)習(xí)工作流的過(guò)程以及訓(xùn)練和部署的架構(gòu)。此外,它可以通過(guò)整個(gè)ML生命周期的有效編排來(lái)加速部署和訓(xùn)練。

      基于整體式ML生命周期和AI工程,有五種主要類型的ML加速器(或加速方面):硬件加速器、AI計(jì)算平臺(tái)、AI框架、ML編譯器和云服務(wù)。先看下面的關(guān)系圖。

      圖1. 訓(xùn)練與部署加速器的關(guān)系

      我們可以看到,硬件加速器和AI框架是加速的主流。但最近,ML編譯器、AI計(jì)算平臺(tái)和ML云服務(wù)已變得越來(lái)越重要。

      下面逐一介紹。

      1. AI框架

      在談到加速M(fèi)L訓(xùn)練和部署時(shí),選擇合適的AI框架無(wú)法回避。遺憾的是,不存在一應(yīng)俱全的完美或最佳AI框架。廣泛用于研究和生產(chǎn)的三種AI框架是TensorFlow、PyTorch和JAX。它們?cè)诓煌姆矫娓饔星铮热缫子眯、產(chǎn)品成熟度和可擴(kuò)展性。

      TensorFlow:TensorFlow是旗艦AI框架。TensorFlow一開(kāi)始就主導(dǎo)深度學(xué)習(xí)開(kāi)源社區(qū)。TensorFlow Serving是一個(gè)定義完備的成熟平臺(tái)。對(duì)于互聯(lián)網(wǎng)和物聯(lián)網(wǎng)來(lái)說(shuō),TensorFlow.js和TensorFlow Lite也已成熟。

      但由于深度學(xué)習(xí)早期探索的局限性,TensorFlow 1.x旨在以一種非Python的方式構(gòu)建靜態(tài)圖。這成為使用“eager”模式進(jìn)行即時(shí)評(píng)估的障礙,這種模式讓PyTorch可以在研究領(lǐng)域迅速提升。TensorFlow 2.x試圖迎頭趕上,但遺憾的是,從TensorFlow 1.x升級(jí)到2.x很麻煩。

      TensorFlow還引入了Keras,以便總體上更易使用,另引入了優(yōu)化編譯器的XLA(加速線性代數(shù)),以加快底層速度。

      PyTorch:憑借其eager模式和類似Python的方法,PyTorch是如今深度學(xué)習(xí)界的主力軍,用于從研究到生產(chǎn)的各個(gè)領(lǐng)域。除了TorchServe外,PyTorch還與跟框架無(wú)關(guān)的平臺(tái)(比如Kubeflow)集成。此外,PyTorch的人氣與Hugging Face的Transformers庫(kù)大獲成功密不可分。

      JAX:谷歌推出了JAX,基于設(shè)備加速的NumPy和JIT。正如PyTorch幾年前所做的那樣,它是一種更原生的深度學(xué)習(xí)框架,在研究領(lǐng)域迅速受到追捧。但它還不是谷歌聲稱的“官方”谷歌產(chǎn)品。

      2. 硬件加速器

      毫無(wú)疑問(wèn),英偉達(dá)的GPU 可以加速深度學(xué)習(xí)訓(xùn)練,不過(guò)它最初是為視頻卡設(shè)計(jì)的。

      通用GPU出現(xiàn)后,用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的圖形卡人氣爆棚。這些通用GPU可以執(zhí)行任意代碼,不僅僅是渲染子例程。英偉達(dá)的CUDA編程語(yǔ)言提供了一種用類似C的語(yǔ)言編寫(xiě)任意代碼的方法。通用GPU有相對(duì)方便的編程模型、大規(guī)模并行機(jī)制和高內(nèi)存帶寬,現(xiàn)在為神經(jīng)網(wǎng)絡(luò)編程提供了一種理想的平臺(tái)。

      如今,英偉達(dá)支持從桌面到移動(dòng)、工作站、移動(dòng)工作站、游戲機(jī)和數(shù)據(jù)中心的一系列GPU。

      隨著英偉達(dá)GPU大獲成功,一路走來(lái)不乏后繼者,比如AMD的GPU和谷歌的TPU ASIC等。

      3. AI計(jì)算平臺(tái)

      如前所述,ML訓(xùn)練和部署的速度很大程度上依賴硬件(比如GPU和TPU)。這些驅(qū)動(dòng)平臺(tái)(即AI計(jì)算平臺(tái))對(duì)性能至關(guān)重要。有兩個(gè)眾所周知的AI計(jì)算平臺(tái):CUDA和OpenCL。

      CUDA:CUDA(計(jì)算統(tǒng)一設(shè)備架構(gòu))是英偉達(dá)于2007年發(fā)布的并行編程范式。它是為圖形處理器和GPU的眾多通用應(yīng)用設(shè)計(jì)的。CUDA是專有API,僅支持英偉達(dá)的Tesla架構(gòu)GPU。CUDA支持的顯卡包括GeForce 8系列、Tesla和Quadro。

      OpenCL:OpenCL(開(kāi)放計(jì)算語(yǔ)言)最初由蘋(píng)果公司開(kāi)發(fā),現(xiàn)由Khronos團(tuán)隊(duì)維護(hù),用于異構(gòu)計(jì)算,包括CPU、GPU、DSP及其他類型的處理器。這種可移植語(yǔ)言的適應(yīng)性足夠強(qiáng),可以讓每個(gè)硬件平臺(tái)實(shí)現(xiàn)高性能,包括英偉達(dá)的GPU。

      英偉達(dá)現(xiàn)在符合OpenCL 3.0,可用于R465及更高版本的驅(qū)動(dòng)程序。使用OpenCL API,人們可以在GPU上啟動(dòng)使用C編程語(yǔ)言的有限子集編寫(xiě)的計(jì)算內(nèi)核。

      4. ML編譯器

      ML編譯器在加速訓(xùn)練和部署方面起著至關(guān)重要的作用。ML編譯器可顯著提高大規(guī)模模型部署的效率。有很多流行的編譯器,比如Apache TVM、LLVM、谷歌MLIR、TensorFlow XLA、Meta Glow、PyTorch nvFuser和Intel PlaidML。

      5. ML云服務(wù)

      ML云平臺(tái)和服務(wù)在云端管理ML平臺(tái)。它們可以通過(guò)幾種方式來(lái)優(yōu)化,以提高效率。

      以Amazon SageMaker為例。這是一種領(lǐng)先的ML云平臺(tái)服務(wù)。SageMaker為ML生命周期提供了廣泛的功能特性:從準(zhǔn)備、構(gòu)建、訓(xùn)練/調(diào)優(yōu)到部署/管理,不一而足。

      它優(yōu)化了許多方面以提高訓(xùn)練和部署效率,比如GPU上的多模型端點(diǎn)、使用異構(gòu)集群的經(jīng)濟(jì)高效的訓(xùn)練,以及適合基于CPU的ML推理的專有Graviton處理器。

      結(jié)語(yǔ)

      隨著深度學(xué)習(xí)訓(xùn)練和部署規(guī)模不斷擴(kuò)大,挑戰(zhàn)性也越來(lái)越大。提高深度學(xué)習(xí)訓(xùn)練和部署的效率很復(fù)雜;贛L生命周期,有五個(gè)方面可以加速M(fèi)L訓(xùn)練和部署:AI框架、硬件加速器、計(jì)算平臺(tái)、ML編譯器和云服務(wù)。AI工程可以將所有這些協(xié)調(diào)起來(lái),利用工程原理全面提高效率。

      原文標(biāo)題:5 Types of ML Accelerators,作者:Luhui Hu

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。