拼多多解開了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資植物生長好幫手:廣明源金線蓮組培燈照亮生長每一步ROG純白系列DIY好物:簡約不失高雅,買它準(zhǔn)沒錯(cuò)!穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過DCI認(rèn)證并投入市場安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎(jiǎng)電動(dòng)自行車強(qiáng)制性“國標(biāo)”再修訂,綠源電動(dòng)車以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對承壓的小家電市場,小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來激光電視主機(jī)僅有iPad大小2024年冷年空調(diào)市場總結(jié):規(guī)模下探,結(jié)構(gòu)降級,空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學(xué)能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀(jì)念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動(dòng)能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機(jī)型蓄勢待發(fā)云天勵(lì)飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革
  • 首頁 > 云計(jì)算頻道 > 大模型

    為AI加速而生 英特爾CPU能跑200億參數(shù)大模型

    2023年12月21日 21:04:47   來源:中文科技資訊

      實(shí)用化 AI 算力又升上了一個(gè)新臺(tái)階。

      在人工智能的應(yīng)用領(lǐng)域,出現(xiàn)了一些讓人始料未及的趨勢:很多傳統(tǒng)企業(yè)開始選擇在CPU平臺(tái)上落地和優(yōu)化AI應(yīng)用。

      例如制造領(lǐng)域在高度精細(xì)且較為耗時(shí)的瑕疵檢測環(huán)節(jié),就導(dǎo)入了CPU及其他產(chǎn)品組合,來構(gòu)建橫跨“云-邊-端”的AI 缺陷檢測方案,代替?zhèn)鹘y(tǒng)的人工瑕疵檢測方式。

      再比如亞信科技就在自家OCR-AIRPA方案中采用了CPU作為硬件平臺(tái),實(shí)現(xiàn)了從FP32到INT8/BF16的量化,從而在可接受的精度損失下,增加吞吐量并加速推理。將人工成本降至原來的1/5到1/9,效率還提升了約5-10倍。

      在處理AI制藥領(lǐng)域最重要的算法——AlphaFold2這類大型模型上,CPU同樣也“加入群聊”。從去年開始,CPU便使AlphaFold2端到端的通量提升到了原來的23.11倍;而現(xiàn)如今,CPU讓這個(gè)數(shù)值再次提升3.02倍。

      上述這些CPU,都有個(gè)共同的名字——至強(qiáng),即英特爾®️ 至強(qiáng)®️ 可擴(kuò)展處理器。

      為什么這些AI任務(wù)的推理能用CPU,而不是只考慮由GPU或AI加速器來處理?

      這里歷來存在很多爭論。

      很多人認(rèn)為,真正落地的AI應(yīng)用往往與企業(yè)的核心業(yè)務(wù)緊密關(guān)聯(lián),在要求推理性能的同時(shí),也需要關(guān)聯(lián)到它的核心數(shù)據(jù),因此對數(shù)據(jù)安全和隱私的要求也很高,因此也更偏向本地化部署。

      而結(jié)合這個(gè)需求,再考慮到真正用AI的傳統(tǒng)行業(yè)更熟悉、更了解也更容易獲取和使用CPU,那么使用服務(wù)器CPU混合精度實(shí)現(xiàn)的推理吞吐量,就是他們能夠更快和以更低成本解決自身需求的方法了。

      面對越來越多傳統(tǒng)AI應(yīng)用和大模型在CPU上的落地優(yōu)化,“用CPU加速AI”這條道路被不斷驗(yàn)證。這就是在數(shù)據(jù)中心中,有70%的推理運(yùn)行在英特爾® 至強(qiáng)® 可擴(kuò)展處理器上的原因。1

      最近,英特爾的服務(wù)器CPU完成了又一次進(jìn)化。12月15日,第五代英特爾® 至強(qiáng)® 可擴(kuò)展處理器正式發(fā)布。英特爾表示,一款為AI加速而生,而且表現(xiàn)更強(qiáng)的處理器誕生了。

      人工智能正在推動(dòng)人類與技術(shù)交互方式的根本性轉(zhuǎn)變,這場轉(zhuǎn)變的中心就是算力。

      英特爾CEO帕特·基辛格(Pat Gelsinger)在2023英特爾ON技術(shù)創(chuàng)新大會(huì)表示:“在這個(gè)人工智能技術(shù)與產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型飛速發(fā)展的時(shí)代,英特爾保持高度的責(zé)任心,助力開發(fā)者,讓AI技術(shù)無處不在,讓AI更易觸達(dá)、更可見、透明并且值得信任。”

      第五代至強(qiáng) 為AI加速

      第五代英特爾® 至強(qiáng)® 可擴(kuò)展處理器的核心數(shù)量增加至64個(gè),配備了高達(dá)320MB的L3緩存和128MB的L2緩存。不論單核性能還是核心數(shù)量,它相比以往的至強(qiáng)都有了明顯提升。在最終性能指標(biāo)上,與上代產(chǎn)品相比,在相同功耗下平均性能提升21%,內(nèi)存帶寬提升高達(dá)16%,三級緩存容量提升到了原來的近3倍。

      更為重要的是,第五代至強(qiáng)® 可擴(kuò)展處理器的每個(gè)內(nèi)核均具備AI加速功能,完全有能力處理要求嚴(yán)苛的AI工作負(fù)載。與上代相比,其訓(xùn)練性能提升多達(dá)29%,推理能力提升高達(dá)42%。

      在重要的AI負(fù)載處理能力上,第五代英特爾® 至強(qiáng)® 可擴(kuò)展處理器也交出了令人滿意的答卷。

      首先要讓CPU學(xué)會(huì)高效處理AI負(fù)載的方法:在第四代至強(qiáng)® 可擴(kuò)展處理器上,英特爾面向深度學(xué)習(xí)任務(wù)帶來了矩陣化的算力支持。

      英特爾®️ AMX就是至強(qiáng)CPU上的專用矩陣計(jì)算單元,可被視為CPU上的Tensor Core,從第四代至強(qiáng)® 可擴(kuò)展處理器開始成為內(nèi)置于CPU的AI加速引擎。

      第五代至強(qiáng)®️ 可擴(kuò)展處理器利用英特爾®️ AMX與英特爾®️ AVX-512指令集,配合更快的內(nèi)核,以及速度更快的內(nèi)存,可以讓生成式AI更快地在其上運(yùn)行,無需獨(dú)立的AI加速器就能執(zhí)行更多工作負(fù)載。

      借助在自然語言處理 (NLP) 推理方面實(shí)現(xiàn)的性能飛躍,這款全新的至強(qiáng)® 可支持響應(yīng)更迅速的智能助手、聊天機(jī)器人、預(yù)測性文本、語言翻譯等工作負(fù)載,可以在運(yùn)行參數(shù)量200億的大語言模型時(shí),做到時(shí)延不超過100毫秒。

      據(jù)了解,11.11期間,京東云便通過基于第五代英特爾® 至強(qiáng)® 可擴(kuò)展處理器的新一代服務(wù)器,成功應(yīng)對了業(yè)務(wù)量激增。與上一代服務(wù)器相比,新一代京東云服務(wù)器實(shí)現(xiàn)了23%的整機(jī)性能提升,AI計(jì)算機(jī)視覺推理性能提升了38%,Llama v2推理性能也提高了51%,輕松hold住用戶訪問峰值同比提高170%、智能客服咨詢量超14億次的大促壓力。

      除此之外,第五代英特爾® 至強(qiáng)® 可擴(kuò)展處理器也在能效、運(yùn)營效率、安全及質(zhì)量等方面實(shí)現(xiàn)了全面提升,提供了向前代產(chǎn)品的軟件和引腳兼容性支持,以及硬件級安全功能和可信服務(wù)。

      國內(nèi)云服務(wù)大廠阿里云也在發(fā)布會(huì)上披露了其實(shí)測體驗(yàn)數(shù)據(jù),基于第五代英特爾® 至強(qiáng)® 可擴(kuò)展處理器及英特爾® AMX、英特爾® TDX加速引擎,阿里云打造了 “生成式AI模型及數(shù)據(jù)保護(hù)”的創(chuàng)新實(shí)踐,使第八代ECS實(shí)例在實(shí)現(xiàn)了全場景加速和全能力提升情況下,更加固了安全性能,且保持實(shí)例價(jià)格不變,普惠客戶。

      數(shù)據(jù)顯示,其在數(shù)據(jù)全流程保護(hù)的基礎(chǔ)上,AI推理性能提高25%、QAT加解密性能提升20%、數(shù)據(jù)庫性能提升25%,以及音視頻性能提升15%。

      英特爾表示,第五代至強(qiáng)® 可擴(kuò)展處理器可為AI、數(shù)據(jù)庫、網(wǎng)絡(luò)和科學(xué)計(jì)算工作負(fù)載帶來更強(qiáng)大的性能和更低的TCO,將目標(biāo)工作負(fù)載的每瓦性能提升高達(dá)10倍。

      對先進(jìn)AI模型實(shí)現(xiàn)原生加速

      為讓CPU能夠高效處理AI任務(wù),英特爾把AI加速的能力提升到了「開箱即用」的程度。

      英特爾®️ AMX除了可以加速深度學(xué)習(xí)的推理、訓(xùn)練以外,現(xiàn)在已經(jīng)支持了流行的深度學(xué)習(xí)框架。在深度學(xué)習(xí)開發(fā)者常用的TensorFlow、PyTorch上,英特爾® oneAPI深度神經(jīng)網(wǎng)絡(luò)庫 (oneDNN) 提供了指令集層面的支持,使開發(fā)人員能夠在不同硬件架構(gòu)和供應(yīng)商之間自由遷移代碼,可以更輕松地利用芯片內(nèi)置的AI加速能力。

      在保證了AI加速直接可用之后,英特爾利用高性能開源深度學(xué)習(xí)框架OpenVINO™ 工具套件,幫助開發(fā)者實(shí)現(xiàn)了一次開發(fā)、多平臺(tái)部署。它可以轉(zhuǎn)換和優(yōu)化使用熱門框架訓(xùn)練好的模型,在多種英特爾硬件的環(huán)境中快速實(shí)現(xiàn),幫用戶最大程度地利用已有資源。

      OpenVINO™ 工具套件最新的版本也加入了對大型語言模型 (LLM) 性能的改進(jìn),可以支持生成式AI工作負(fù)載,包括聊天機(jī)器人、智能助手、代碼生成模型等。

      OpenVINO™ 工具套件2

      通過這一系列技術(shù),英特爾讓開發(fā)者們能夠在幾分鐘內(nèi)調(diào)優(yōu)深度學(xué)習(xí)模型,或完成對中小型深度學(xué)習(xí)模型的訓(xùn)練,在不增加硬件和系統(tǒng)復(fù)雜性的前提下獲得媲美獨(dú)立AI加速器的性能。

      比如在先進(jìn)的預(yù)訓(xùn)練大語言模型上,英特爾的技術(shù)就可以幫助用戶完成快速部署。

      用戶可以從最熱門的機(jī)器學(xué)習(xí)代碼庫Hugging Face中下載預(yù)訓(xùn)練模型LLaMA2,然后使用英特爾®️ PyTorch、英特爾®️ Neural Compressor等將模型轉(zhuǎn)換為BF16或INT8精度版本以降低延遲,再使用PyTorch進(jìn)行部署。

      英特爾表示,為了能夠緊跟AI領(lǐng)域的潮流,有數(shù)百名軟件開發(fā)人員正在不斷改進(jìn)常用的模型加速能力,讓用戶能夠在跟上最新軟件版本的同時(shí),獲得對于先進(jìn)AI模型的支持。

      第五代至強(qiáng)® 可擴(kuò)展處理器的實(shí)力,目前已在部分大廠進(jìn)行了驗(yàn)證。火山引擎與英特爾合作升級了第三代彈性計(jì)算實(shí)例。

      目前,火山引擎已通過獨(dú)有的潮汐資源并池能力,構(gòu)建百萬核彈性資源池,能夠以近似包月的成本提供按量使用體驗(yàn),降低上云成本;诘谖宕⑻貭® 至強(qiáng)® 可擴(kuò)展處理器,火山引擎第三代彈性計(jì)算實(shí)例整機(jī)算力再次提升了39%,應(yīng)用性能最高提升了43%。

      這只是個(gè)開始。可以預(yù)見,很快會(huì)有更多科技公司的應(yīng)用能夠從第五代至強(qiáng)®️ 可擴(kuò)展處理器的性能中獲益。

      下一代至強(qiáng)已經(jīng)現(xiàn)身

      未來,人們對于生成式AI的需求還將不斷擴(kuò)大,更多的智能化應(yīng)用將會(huì)改變我們的生活。以計(jì)算能力為基礎(chǔ),萬物感知、萬物互聯(lián)、萬物智能的時(shí)代正在加速到來。

      面對這樣的趨勢,英特爾正在加緊打造再下一代的至強(qiáng)CPU,它們面向AI的「專業(yè)化」程度還會(huì)更高。

      在最近披露的英特爾數(shù)據(jù)中心路線圖上,下一代至強(qiáng)® 處理器將對不同工作負(fù)載、場景配備不同的核心,其中主打計(jì)算密集型與AI任務(wù)的型號會(huì)使用側(cè)重性能輸出的核「P-core」,面向高密度與橫向擴(kuò)展負(fù)載的型號則會(huì)使用有更高能效的核「E-core」,這兩種不同的核心架構(gòu)并存的設(shè)計(jì),既滿足部分用戶對極致性能的追求,也能兼顧到可持續(xù)發(fā)展綠色節(jié)能的需求。

      未來,英特爾還將如何實(shí)現(xiàn)晶體管和芯片性能的飛躍,在AI算力上還能有什么樣的躍升?

      讓我們拭目以待。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    [No. S013]
    分享到微信

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。