合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬(wàn)輛,到 2027 年建成萬(wàn)億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來(lái)了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來(lái)了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購(gòu)物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測(cè)試版現(xiàn)已開放革命性AI對(duì)話系統(tǒng)Moshi問(wèn)世:機(jī)器也能說(shuō)人話了?
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    如何馴服AI大模型“能耗巨獸”

    2023年12月01日 10:52:37   來(lái)源:中國(guó)電子報(bào)、電子信息產(chǎn)業(yè)網(wǎng)

      AIGC及其背后的大模型,是不折不扣的“能耗巨獸”。在部署大模型的過(guò)程中,AI工作負(fù)載帶來(lái)的功耗和成本挑戰(zhàn),已然成為產(chǎn)業(yè)鏈的“阿喀琉斯之踵”。近期,螞蟻集團(tuán)聯(lián)合多所高校發(fā)布的《圍繞綠色計(jì)算發(fā)展機(jī)遇的一項(xiàng)調(diào)查》(以下簡(jiǎn)稱“調(diào)查”)指出,綠色措施、節(jié)能人工智能、節(jié)能計(jì)算系統(tǒng)和可持續(xù)發(fā)展的人工智能用是構(gòu)建綠色計(jì)算的四個(gè)關(guān)鍵,強(qiáng)調(diào)了人工智能的節(jié)能降耗對(duì)于計(jì)算產(chǎn)業(yè)的意義。與此同時(shí),恩智浦、英特爾、英偉達(dá)等半導(dǎo)體企業(yè)也在積極應(yīng)對(duì)大模型帶來(lái)的能耗挑戰(zhàn),從架構(gòu)創(chuàng)新、軟硬件協(xié)同方案、網(wǎng)絡(luò)平臺(tái)等多個(gè)層面,為大模型部署提質(zhì)降耗。

      為“大腦”分擔(dān)任務(wù) 半導(dǎo)體廠商的架構(gòu)創(chuàng)新方法論

      大模型作為近年來(lái)最重要的新興計(jì)算場(chǎng)景,對(duì)芯片的算力和內(nèi)存需求都提出了極大挑戰(zhàn)。北京大學(xué)集成電路學(xué)院研究員賈天宇向《中國(guó)電子報(bào)》記者表示,在傳統(tǒng)摩爾定律難以為繼的背景下,半導(dǎo)體企業(yè)需要通過(guò)利用架構(gòu)設(shè)計(jì)、制造工藝、先進(jìn)封裝等多個(gè)層級(jí)協(xié)同的設(shè)計(jì)手段來(lái)滿足大模型的計(jì)算需求。例如,通過(guò)采用異構(gòu)計(jì)算、存算一體、三維堆疊等先進(jìn)計(jì)算理念降低芯片的能耗,提高單一芯片的性能和能效。此外,針對(duì)大模型的大算力需求,芯片的可擴(kuò)展性也變得尤為重要。重視多芯片的系統(tǒng)級(jí)擴(kuò)展和互聯(lián)技術(shù),也成為半導(dǎo)體企業(yè)技術(shù)研發(fā)中不可忽視的重要內(nèi)容。

      “在控制大模型帶來(lái)的能耗和成本方面,半導(dǎo)體企業(yè)可以通過(guò)優(yōu)化計(jì)算架構(gòu)、提升能效等措施,降低大模型的能耗和成本。但針對(duì)大規(guī)模的大模型訓(xùn)練,需要與軟件生態(tài)、數(shù)據(jù)中心建設(shè)等多環(huán)節(jié)配合,共同為企業(yè)和開發(fā)者提供更具成本效益的解決方案。”賈天宇說(shuō)。

      如賈天宇所說(shuō),架構(gòu)創(chuàng)新素來(lái)被視為實(shí)現(xiàn)芯片技術(shù)突破的發(fā)動(dòng)機(jī)。在采訪中,多家半導(dǎo)體企業(yè)負(fù)責(zé)人都向記者闡述了基于架構(gòu)創(chuàng)新和優(yōu)化為大模型增效降耗的思路。

      長(zhǎng)期以來(lái),人工智能及其熱門應(yīng)用常常被喻為“大腦”,比如自動(dòng)駕駛被喻為“車輪上的大腦”。但是,人腦并不是僅僅依靠大腦工作,腦干、小腦也承擔(dān)了許多任務(wù),比如控制心跳和體溫,保持身體的穩(wěn)定性、協(xié)調(diào)性等。如果大腦進(jìn)行所有的決策和控制,人體就很難負(fù)擔(dān)大腦需要的能量。

      比照包含大腦、小腦、腦干的人腦系統(tǒng),恩智浦半導(dǎo)體執(zhí)行副總裁兼首席技術(shù)官Lars Reger為記者描述了一種更加高效節(jié)能的計(jì)算體系:以AI算力芯片為“大腦”,進(jìn)行高效能的計(jì)算和加速;以網(wǎng)關(guān)處理器為“小腦”,實(shí)現(xiàn)不同功能區(qū)的互聯(lián)和集成,以及異構(gòu)網(wǎng)絡(luò)中的數(shù)據(jù)處理;以MCU、感知芯片、聯(lián)網(wǎng)芯片作為“腦干”,實(shí)現(xiàn)感知和實(shí)時(shí)任務(wù)處理。

      “有的車廠CEO告訴我們,由于能耗的問(wèn)題,他們不得不降低汽車的續(xù)航,這主要是因?yàn)楝F(xiàn)有的技術(shù)架構(gòu)不夠高效。所以在開發(fā)系統(tǒng)時(shí),我們要確保在正常運(yùn)行的情況下,不需要時(shí)刻激活大腦的功能,只要小腦就可以了。比如我們?cè)陂_車的時(shí)候,更多是基于平時(shí)的規(guī)則和訓(xùn)練下意識(shí)地駕駛,只有遇到挑戰(zhàn)的時(shí)候才需要用到大腦。”Lars Reger向《中國(guó)電子報(bào)》記者表示。

      據(jù)悉,恩智浦已經(jīng)將這套計(jì)算理念集成到了智能駕駛的技術(shù)架構(gòu)中,架構(gòu)中“小腦”和“腦干”部分由恩智浦的技術(shù)來(lái)保障的。S32G作為網(wǎng)關(guān)處理器,扮演小腦的角色;S32K等用于車身各部分控制的MCU、S32R等傳感芯片、S32Z等域控制和區(qū)域控制芯片以及以太網(wǎng)連接產(chǎn)品,共同構(gòu)成“腦干”,以應(yīng)對(duì)能耗對(duì)續(xù)航的局限和挑戰(zhàn)。此外,《中國(guó)電子報(bào)》記者獲悉,恩智浦即將推出最新的5納米級(jí)旗艦產(chǎn)品,能夠把數(shù)據(jù)從車輛傳輸?shù)娇刂茊卧?/p>

      跟著最新算法走 隨時(shí)提供軟硬件協(xié)同方案

      隨著業(yè)界對(duì)大模型的研發(fā)和部署逐步深入,新的壓縮、調(diào)優(yōu)方式層出不窮,從算法和框架層面實(shí)現(xiàn)對(duì)大模型的提效降耗。但算法、框架的更新,需要半導(dǎo)體廠商及時(shí)跟上,提供相應(yīng)的軟硬件協(xié)同方案,才能實(shí)現(xiàn)新算法、新框架的部署。

      比如,大模型的調(diào)優(yōu)方式,正在從完全微調(diào)走向更加簡(jiǎn)捷、低功耗的微調(diào)方式。螞蟻集團(tuán)聯(lián)合多所高校發(fā)布的《圍繞綠色計(jì)算發(fā)展機(jī)遇的一項(xiàng)調(diào)查》提到,傳統(tǒng)的調(diào)優(yōu)方式會(huì)微調(diào)所有模型參數(shù),使通用大型語(yǔ)言模型適應(yīng)特定的目標(biāo)任務(wù),這一過(guò)程稱為完全微調(diào)。然而,當(dāng)大模型的參數(shù)規(guī)模從百萬(wàn)、千萬(wàn)向數(shù)億乃至萬(wàn)億規(guī)模發(fā)展,完全微調(diào)會(huì)帶來(lái)更長(zhǎng)的程序代碼運(yùn)行時(shí)間和高昂的存儲(chǔ)成本。為了解決這個(gè)問(wèn)題,更加簡(jiǎn)捷的微調(diào)方法已成為大模型的研究熱點(diǎn)。比如PEFT(高效參數(shù)微調(diào))僅更新模型參數(shù)的子集或附加的模塊,使大模型適配下游任務(wù),以降低微調(diào)所需的計(jì)算和存儲(chǔ)資源;基于提示的微調(diào)則訓(xùn)練大模型根據(jù)特定提示或指令生成響應(yīng),引導(dǎo)大模型做出更理想的決策和行動(dòng)。由于無(wú)需添加更多的訓(xùn)練數(shù)據(jù),基于提示的微調(diào)能節(jié)省大量的時(shí)間和成本,以實(shí)現(xiàn)更加綠色的計(jì)算。

      圍繞基于提示的微調(diào)等最新微調(diào)方式,英特爾基于AI加速引擎和配套的軟件工具,進(jìn)一步減少了微調(diào)所需的工作量。第四代英特爾至強(qiáng)可擴(kuò)展處理器中內(nèi)置了矩陣乘法加速器AMX,能夠更快速地處理 BFloat16(BF16)或INT8數(shù)據(jù)類型的矩陣乘加運(yùn)算,從而提升模型訓(xùn)練和推理的性能。尤其對(duì)于ChatGLM-6B等在開源微調(diào)代碼中支持CPU 自動(dòng)混合精度的大模型,開發(fā)者在啟動(dòng)微調(diào)時(shí)加入CPU自動(dòng)混合精度的使能參數(shù),就可以直接利用矩陣乘法加速器提升大模型的微調(diào)計(jì)算速度。

      英特爾院士、大數(shù)據(jù)技術(shù)全球CTO戴金權(quán)向《中國(guó)電子報(bào)》記者表示,解題大模型功耗和成本壓力的關(guān)鍵,是根據(jù)不同大模型的最新 技術(shù)需求,提供軟硬件協(xié)同的支撐方案。

      “我們可以通過(guò)提供跨平臺(tái)的XPU架構(gòu)和開放的AI軟件架構(gòu)及優(yōu)化,為預(yù)訓(xùn)練、微調(diào)、推理等不同的AI和大模型應(yīng)用,提供高效的開發(fā)部署平臺(tái)。”戴金權(quán)告訴記者。據(jù)他介紹,英特爾在硬件架構(gòu)方面,正在基于Gaudi AI加速器,數(shù)據(jù)中心Max GPU,內(nèi)置AMX加速的第四代至強(qiáng)處理器,以及邊緣和客戶端處理器為用戶提供XPU異構(gòu)計(jì)算支持。在軟件架構(gòu)層面,英特爾和社區(qū)在PyTorch、DeepSpeed、HuggingFace Transformers等開源項(xiàng)目開展合作,加入了在Intel XPU平臺(tái)上的眾多優(yōu)化。同時(shí),英特爾的開源軟件工具IPEX、BigDL、INC、OpenVINO等,對(duì)大模型提供專門的支持和加速。

      加速與降耗并行 打造更加節(jié)能的基礎(chǔ)設(shè)施

      數(shù)據(jù)中心是AIGC和大模型主要的基礎(chǔ)設(shè)施之一,也是節(jié)能技術(shù)的重點(diǎn)發(fā)力領(lǐng)域。隨著全球的熱點(diǎn)IT應(yīng)用地區(qū)都在強(qiáng)調(diào)綠色數(shù)據(jù)中心,如何在降低能耗的同時(shí)釋放更高效能,成為英偉達(dá)、AMD等數(shù)據(jù)中心芯片供應(yīng)商的必答題。

      圍繞數(shù)據(jù)中心的減碳需求,AMD宣布了到2025年為人工智能訓(xùn)練和高性能計(jì)算應(yīng)用程序帶來(lái)30倍能效提升的目標(biāo)。據(jù)AMD測(cè)算,30倍的能效提升將在2025年節(jié)省數(shù)十億千瓦時(shí)的電力,使系統(tǒng)在五年內(nèi)完成單次計(jì)算所需的電力減少97%。這一方面需要核心制程的提升,另一方面需要架構(gòu)的改進(jìn)和技術(shù)的創(chuàng)新來(lái)提高算力。比如基于一顆第三代AMD EPYC服務(wù)器處理器和四個(gè)AMD Instinct MI250x GPU的加速節(jié)點(diǎn),AMD實(shí)現(xiàn)了在2020年的基準(zhǔn)水平之上提高6.79倍能效。

      英偉達(dá)也將加速計(jì)算作為減少功耗的主要策略。加速庫(kù)是英偉達(dá)加速計(jì)算的核心,目前英偉達(dá)面向計(jì)算機(jī)視覺、數(shù)據(jù)處理、機(jī)器學(xué)習(xí)和 AI 等領(lǐng)域布局了300 個(gè)加速庫(kù)和400 個(gè) AI 模型。

      除了提升計(jì)算單元的能效,計(jì)算單元構(gòu)成的AI集群,也對(duì)數(shù)據(jù)中心的整體功耗有著重要影響。在計(jì)算單元互聯(lián)以構(gòu)建AI集群,以及集群、設(shè)備互聯(lián)構(gòu)建AI計(jì)算網(wǎng)絡(luò)的過(guò)程中,會(huì)產(chǎn)生大量網(wǎng)絡(luò)數(shù)據(jù)。若采用傳統(tǒng)的以太網(wǎng)架構(gòu),會(huì)導(dǎo)致數(shù)據(jù)流的擁塞和延遲,使系統(tǒng)無(wú)法有效利用GPU,從而提升了大模型訓(xùn)練的時(shí)間和成本。

      在網(wǎng)絡(luò)平臺(tái)層面,英偉達(dá)推出專門面向AI負(fù)載的以太網(wǎng)架構(gòu)Spectrum-X。該架構(gòu)基于內(nèi)置Spectrum-4 AISC芯片的交換機(jī)與Blue-Field DPU,提升AI集群的資源利用和數(shù)據(jù)傳輸效率。在對(duì)GPT-3的訓(xùn)練中,NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺(tái)相比傳統(tǒng)以太網(wǎng)網(wǎng)絡(luò)架構(gòu),實(shí)現(xiàn)了的 1.7 倍的加速效果。尤其針對(duì)數(shù)據(jù)中心常用的功率封頂措施,Spectrum-4 ASIC能夠簡(jiǎn)化網(wǎng)絡(luò)設(shè)計(jì),提高了每瓦的性能,幫助數(shù)據(jù)中心控制網(wǎng)絡(luò)功率預(yù)算。

      從計(jì)算架構(gòu)的革新,軟硬件方案的更新,到基礎(chǔ)設(shè)施算力和互聯(lián)方式的迭代,半導(dǎo)體廠商正在從多個(gè)維度緩解大模型帶來(lái)的能耗壓力。而大模型的到來(lái),也在倒逼算力系統(tǒng)的創(chuàng)新,為基礎(chǔ)軟硬件的各個(gè)節(jié)點(diǎn)帶來(lái)新的市場(chǎng)機(jī)會(huì)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。