作者:Arm 物聯(lián)網(wǎng)事部業(yè)務(wù)拓展副總裁 馬健
當(dāng)下,我們正處在激動(dòng)人心的人工智能 (AI) 技術(shù)變革初期階段。隨著自然語(yǔ)言、多模態(tài)大模型以及生成式 AI 技術(shù)的加速演進(jìn),AI 正以前所未有的速度重塑各行各業(yè)。根據(jù) IDC 的預(yù)測(cè),全球數(shù)據(jù)量將從 2024 年的 159.2ZB 增長(zhǎng)到 2028 年的超過(guò) 384.6ZB,年復(fù)合增長(zhǎng)率達(dá) 24.4%。其中,到 2028 年,預(yù)計(jì) 37% 的數(shù)據(jù)將會(huì)在云端直接產(chǎn)生,而其余數(shù)據(jù)會(huì)從邊緣端和終端直接產(chǎn)生。
面對(duì)邊緣數(shù)據(jù)的激增,高效的數(shù)據(jù)處理、低延遲傳輸以及智能、安全的存儲(chǔ)正成為行業(yè)關(guān)注的重點(diǎn)。未來(lái)的計(jì)算架構(gòu)不僅要提供更強(qiáng)的算力,還必須更緊密地與存儲(chǔ)系統(tǒng)結(jié)合,以確保 AI 模型能夠高效運(yùn)行,同時(shí)優(yōu)化數(shù)據(jù)管理和訪問(wèn)方式。
從目前的 AI 技術(shù)發(fā)展方向來(lái)看,一方面,大模型正向通用人工智能 (AGI) 演進(jìn),探索多模態(tài)、物理 AI 等新方向,并持續(xù)挑戰(zhàn)算力的新極限。另一方面,為推進(jìn)大模型全面部署的進(jìn)程,行業(yè)開(kāi)始邁向深度優(yōu)化和垂直領(lǐng)域定制化,使大模型能走入千行百業(yè),適應(yīng)移動(dòng)端、邊緣計(jì)算、云端部署等不同場(chǎng)景。
DeepSeek 的推出對(duì)全球 AI 市場(chǎng)產(chǎn)生了深遠(yuǎn)影響:作為一種開(kāi)放的創(chuàng)新技術(shù),它不僅展示了 AI 在訓(xùn)練與推理過(guò)程中的優(yōu)化潛力,還極大提高了大規(guī)模部署的效率,充分證明了模型能夠在更低成本、更高效能的環(huán)境中穩(wěn)定運(yùn)行。這一成就對(duì)于推動(dòng) AI 在企業(yè)級(jí)應(yīng)用和邊緣計(jì)算領(lǐng)域的大規(guī)模應(yīng)用具有重要意義。
Arm 計(jì)算平臺(tái):持續(xù)促進(jìn)從云到端的 AI 優(yōu)化部署
在 AI 發(fā)展的初期階段,數(shù)據(jù)中心作為模型訓(xùn)練和初期推理的核心場(chǎng)所,正面臨著前所未有的挑戰(zhàn)。傳統(tǒng)的標(biāo)準(zhǔn)通用芯片在處理計(jì)算密集型的 AI 工作負(fù)載時(shí)顯得力不從心,無(wú)法滿足 AI 時(shí)代對(duì)于高性能、低功耗以及靈活擴(kuò)展性的迫切需求。在此背景下,Arm 計(jì)算平臺(tái)憑借其先進(jìn)的技術(shù)優(yōu)勢(shì),為新一代 AI 云基礎(chǔ)設(shè)施的發(fā)展開(kāi)辟了新的范式。從 Arm Neoverse 計(jì)算子系統(tǒng) (CSS)、Arm Total Design 生態(tài)項(xiàng)目到芯粒系統(tǒng)架構(gòu) (CSA),Arm 進(jìn)行了從技術(shù)到生態(tài)的整體化布局,不僅為 AI 數(shù)據(jù)中心的工作負(fù)載提供了高效、靈活且可擴(kuò)展的解決方案,還幫助合作伙伴專注于產(chǎn)品差異化,為產(chǎn)品上市進(jìn)程提速。
AI 推理是 AI 釋放價(jià)值的關(guān)鍵,它正迅速?gòu)脑贫送卣怪吝吘壎,覆蓋世界的每一個(gè)角落。在邊緣 AI 領(lǐng)域,Arm 憑借其技術(shù)與生態(tài)的獨(dú)特優(yōu)勢(shì),不斷創(chuàng)新,確保智能物聯(lián)網(wǎng)與消費(fèi)電子生態(tài)系統(tǒng)能在恰當(dāng)?shù)臅r(shí)機(jī)、于最適合的地點(diǎn)執(zhí)行最優(yōu)工作負(fù)載。
為了滿足邊緣 AI 日益攀升的 AI 工作負(fù)載需求,Arm 近期發(fā)布了以全新 Armv9 超高能效 CPU Cortex-A320 以及對(duì) Transformer 網(wǎng)絡(luò)具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣 AI 計(jì)算平臺(tái)。該平臺(tái)實(shí)現(xiàn)了 CPU 與 AI 加速器的深度集成。相比去年以 Cortex-M85 搭配 Ethos-U85 的平臺(tái)提升了八倍的機(jī)器學(xué)習(xí) (ML) 計(jì)算性能,帶來(lái)了顯著的 AI 計(jì)算能力突破,可賦能邊緣 AI 設(shè)備輕松運(yùn)行超過(guò) 10 億參數(shù)的大模型。
圖:Arm 邊緣 AI 計(jì)算平臺(tái)支持運(yùn)行超 10 億參數(shù)的端側(cè) AI 模型
其中,全新發(fā)布的超高能效 Cortex-A320 不僅可以為 Ethos-U85 提供更高的內(nèi)存容量與帶寬,讓大模型在 Ethos-U85 上的執(zhí)行如虎添翼,還支持更大的可尋址內(nèi)存空間,并能夠更靈活地管理多層次內(nèi)存訪問(wèn)延遲。Cortex-A320 與 Ethos-U85 的組合,是運(yùn)行大模型及應(yīng)對(duì)邊緣 AI 任務(wù)所帶來(lái)的內(nèi)存容量及帶寬挑戰(zhàn)的理想選擇。
此外,Cortex-A320 還充分利用了 Armv9 增強(qiáng)的 AI 計(jì)算特性以及包括 Secure EL2、指針驗(yàn)證/分支目標(biāo)識(shí)別 (PACBTI) 以及內(nèi)存標(biāo)記擴(kuò)展 (MTE) 等在內(nèi)的安全特性。此前,這些特性已經(jīng)在其他市場(chǎng)得到廣泛應(yīng)用,而 Arm 現(xiàn)在將其引入了物聯(lián)網(wǎng)與邊緣 AI 計(jì)算領(lǐng)域,在提供出色且靈活 AI 性能的同時(shí),實(shí)現(xiàn)對(duì)軟件負(fù)載更好的隔離與軟件內(nèi)存異常的防護(hù),提高整體系統(tǒng)安全性。
AI 時(shí)代的存儲(chǔ)發(fā)展:存儲(chǔ)、計(jì)算和安全能力的全面升級(jí)
隨著 AI 計(jì)算需求的持續(xù)增長(zhǎng),云邊端在對(duì)計(jì)算能力提出更高要求的同時(shí),也對(duì)存儲(chǔ)系統(tǒng)的性能、密度、實(shí)時(shí)性和功耗等方面提出了更嚴(yán)苛的要求。在傳統(tǒng)模式下,計(jì)算架構(gòu)往往將存儲(chǔ)和計(jì)算相對(duì)分離,存儲(chǔ)設(shè)備僅僅承擔(dān)數(shù)據(jù)存放的角色,數(shù)據(jù)需要在存儲(chǔ)與計(jì)算節(jié)點(diǎn)之間頻繁搬移,導(dǎo)致“存儲(chǔ)-計(jì)算”之間的瓶頸。然而在 AI 時(shí)代,為滿足數(shù)據(jù)實(shí)時(shí)分析、智能管理及高效訪問(wèn)等需求,將存儲(chǔ)置于離計(jì)算單元更近的地方,或讓存儲(chǔ)本身具備計(jì)算能力,變得尤為關(guān)鍵。這樣能夠確保 AI 任務(wù)在最合適的位置得到高效執(zhí)行。
從云到端的 AI 計(jì)算,對(duì)存儲(chǔ)吞吐量、延遲、能耗、安全以及諸如 Open Channel 等提升主機(jī)可管理性 (host manageability) 的需求都不盡相同。存儲(chǔ)控制器以及運(yùn)行在存儲(chǔ)控制器中 Arm CPU 上的固件在支持差異化 AI 存儲(chǔ)需求中起到了極其重要的作用。
圖:Arm 豐富的 IP 平臺(tái)解決方案為 AI 存儲(chǔ)提供領(lǐng)先的性能及能效
事實(shí)上,作為數(shù)據(jù)存儲(chǔ)與網(wǎng)絡(luò)控制的基石,Arm 一直在為全球存儲(chǔ)控制器和設(shè)備提供高性能、低功耗、安全可靠的解決方案,其中包括:
· Arm Cortex-R 系列實(shí)時(shí)處理器擁有最快的中斷延時(shí)和實(shí)時(shí)反應(yīng)速度,被廣泛應(yīng)用于諸多存儲(chǔ)設(shè)備;
· Arm Cortex-M 系列嵌入式處理器是后端閃存和媒體控制的熱門選擇,并支持自定義指令,客戶可以針對(duì)獨(dú)特 NAND 介質(zhì)的深度優(yōu)化來(lái)創(chuàng)造差異;
· Arm Cortex-A 系列應(yīng)用處理器以高吞吐量流水線設(shè)計(jì)、支持最高處理性能,同時(shí)擁有 ML、數(shù)據(jù)處理軟件和豐富操作系統(tǒng)的堅(jiān)實(shí)生態(tài)支持;
· Arm Ethos-U AI 加速器支持每秒 2048MACs 的 Transformer 原生加速,可以助力存儲(chǔ)控制器本身變得更智能;
· 此外,還有為數(shù)據(jù)中心量身定制的 Neoverse。我們已開(kāi)始看到 CXL (Compute Express Link) 方面的創(chuàng)新設(shè)計(jì)采用 Arm Coherent Mesh Network (CMN) 與 Neoverse 組合實(shí)現(xiàn)可“組成式”內(nèi)存擴(kuò)展,并融入近存儲(chǔ)計(jì)算的理念,減少數(shù)據(jù)搬運(yùn)。
生態(tài)攜手,構(gòu)建 AI 計(jì)算與存儲(chǔ)未來(lái)
在專注提供領(lǐng)先的技術(shù)和產(chǎn)品的同時(shí),Arm 還致力于和生態(tài)系統(tǒng)合作伙伴攜手共進(jìn),共同推動(dòng)存儲(chǔ)產(chǎn)業(yè)的發(fā)展; Arm 架構(gòu)的平臺(tái)正被行業(yè)領(lǐng)先的存儲(chǔ)企業(yè)廣泛采用,以優(yōu)化其存儲(chǔ)解決方案。例如,Solidigm 公司最新發(fā)布的 122TB PCIe SSD Solidigm™ D5-P5336 顯著提升了 AI 數(shù)據(jù)中心的能效、存儲(chǔ)密度和性能,其存儲(chǔ)控制器采用 Arm Cortex-R CPU,有效提升了讀寫(xiě)的實(shí)時(shí)性和延時(shí)確定性;慧榮科技 (Silicon Motion) 面向 AI PC 的 SM2508 主控芯片采用了 Arm Cortex-R8 與 Cortex-M0,在能效和數(shù)據(jù)吞吐上實(shí)現(xiàn)了突破,其 SM2264XT-AT 是業(yè)界首款車用 PCIe Gen4 主控芯片,通過(guò)增強(qiáng)的虛擬化來(lái)支持混合關(guān)鍵性工作負(fù)載對(duì)數(shù)據(jù)的訪問(wèn),并可節(jié)省 30% 的能耗;江波龍基于 Arm Cortex-R CPU 打造的 XP2300、ORCA 4836 以及 UNCIA 3836 固態(tài)硬盤(pán),憑借其大容量與高性能的優(yōu)勢(shì),廣泛應(yīng)用于 AI PC、服務(wù)器、云計(jì)算、分布式存儲(chǔ)及邊緣計(jì)算等多個(gè)應(yīng)用場(chǎng)景,滿足 AI 技術(shù)的本地化部署需求。
此外,在本土存儲(chǔ)市場(chǎng),大普微、聯(lián)蕓科技、憶芯科技、特納飛、得一微電子、英韌科技等領(lǐng)先的存儲(chǔ)企業(yè),也都廣泛采用 Arm 技術(shù)打造 SSD 主控芯片與設(shè)備方案。
迄今為止,基于 Arm 架構(gòu)和平臺(tái)所應(yīng)用的存儲(chǔ)設(shè)備已近 200 億臺(tái),其中包括云和企業(yè)級(jí) SSD、車載 SSD、消費(fèi)級(jí) SSD、硬盤(pán)驅(qū)動(dòng)器和嵌入式閃存設(shè)備。目前,由 Arm 技術(shù)賦能的存儲(chǔ)設(shè)備持續(xù)保持在每日大約 300 萬(wàn)臺(tái)的出貨量。
憑借前沿的技術(shù)實(shí)力、豐富的生態(tài)布局、深厚的存儲(chǔ)行業(yè)積累,Arm 正繼續(xù)引領(lǐng)技術(shù)創(chuàng)新,賦能 AI 時(shí)代的計(jì)算與存儲(chǔ)發(fā)展。Arm 也將繼續(xù)與合作伙伴攜手,通過(guò)安全、高效的 Arm 計(jì)算平臺(tái),構(gòu)建 AI 時(shí)代計(jì)算與存儲(chǔ)的新未來(lái)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
根據(jù)2月底內(nèi)部溝通會(huì)上的消息,在美團(tuán)發(fā)展的第二個(gè)十年,“科技”成了公司創(chuàng)始人兼CEO王興會(huì)更多關(guān)注的方向之一。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。