" />
宏景智駕完成數(shù)億元C輪融資植物生長(zhǎng)好幫手:廣明源金線(xiàn)蓮組培燈照亮生長(zhǎng)每一步ROG純白系列DIY好物:簡(jiǎn)約不失高雅,買(mǎi)它準(zhǔn)沒(méi)錯(cuò)!穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過(guò)DCI認(rèn)證并投入市場(chǎng)安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎(jiǎng)電動(dòng)自行車(chē)強(qiáng)制性“國(guó)標(biāo)”再修訂,綠源電動(dòng)車(chē)以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對(duì)承壓的小家電市場(chǎng),小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營(yíng)收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來(lái)激光電視主機(jī)僅有iPad大小2024年冷年空調(diào)市場(chǎng)總結(jié):規(guī)模下探,結(jié)構(gòu)降級(jí),空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學(xué)能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢(qián)過(guò)億,70%用戶(hù)靠投流,大模型算不過(guò)成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀(jì)念版PS5、PS5 Pro:限量賣(mài)泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動(dòng)能電商12年 ,ALL IN 小紅書(shū),開(kāi)店3月賣(mài)出1100萬(wàn)Mate 70最受期待!華為三款重磅機(jī)型蓄勢(shì)待發(fā)云天勵(lì)飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充
  • 首頁(yè) > 數(shù)據(jù)存儲(chǔ)頻道 > 數(shù)據(jù).存儲(chǔ)頻道 > 存儲(chǔ)資訊

    算力大升級(jí) 英特爾至強(qiáng)可擴(kuò)展處理器持續(xù)技術(shù)創(chuàng)新

    2023年12月29日 09:15:15   來(lái)源:中文科技資訊

      過(guò)去半年中,隨著大模型產(chǎn)品的爆發(fā),AI帶來(lái)的變革已經(jīng)逐漸凸顯。算力承載著AI的研究和應(yīng)用,其格局變化尤為明顯。

      2023年,生成式AI研究和應(yīng)用的爆發(fā)給云計(jì)算產(chǎn)業(yè)帶來(lái)了全新的機(jī)遇和挑戰(zhàn):大模型需要龐大的算力支持,用戶(hù)普遍需要向云計(jì)算廠(chǎng)商購(gòu)買(mǎi)算力服務(wù);且由于大量用戶(hù)涌入云服務(wù)市場(chǎng),云廠(chǎng)商需要盡快升級(jí)數(shù)據(jù)中心算力以應(yīng)對(duì)AI需求,同時(shí)持續(xù)降低TCO,為用戶(hù)提供價(jià)格合理的算力資源;此外,AI應(yīng)用開(kāi)發(fā)還涉及大量隱私敏感數(shù)據(jù)的云端存儲(chǔ)和使用,云廠(chǎng)商也要全力保障這些數(shù)據(jù)的安全可靠,打消用戶(hù)后顧之憂(yōu)。

      基于上述需求,云廠(chǎng)商迫切需要對(duì)已有硬件基礎(chǔ)設(shè)施進(jìn)行更新?lián)Q代,要求新一代CPU能在保障基礎(chǔ)設(shè)施平穩(wěn)升級(jí)迭代的同時(shí),具備更強(qiáng)的性能、更低的TCO,同時(shí)能夠滿(mǎn)足云端多樣化工作負(fù)載需求的較強(qiáng)AI能力:

      對(duì)于大型云服務(wù)基礎(chǔ)設(shè)施而言,穩(wěn)定性、可靠性依然是王道,因此云服務(wù)廠(chǎng)商升級(jí)硬件時(shí)決策更加謹(jǐn)慎,偏向于在有著長(zhǎng)期延續(xù)性的主流平臺(tái)上逐漸迭代,保護(hù)上層軟件應(yīng)用投資,減小對(duì)基礎(chǔ)設(shè)施開(kāi)發(fā)運(yùn)維部門(mén)的沖擊。大模型在云端訓(xùn)練、推理的過(guò)程需要用戶(hù)將大量數(shù)據(jù)傳輸至云端,云廠(chǎng)商需要采取更強(qiáng)的安全措施,如硬件級(jí)的安全引擎來(lái)更好地保障敏感數(shù)據(jù)的安全,確保云實(shí)例間的數(shù)據(jù)隔離,預(yù)防惡意入侵和泄漏。AI應(yīng)用涉及密集的低精度矩陣運(yùn)算,需要較大的內(nèi)存空間。對(duì)于大模型推理應(yīng)用和中小尺度(參數(shù)規(guī)模低于20B)模型的訓(xùn)練應(yīng)用而言,其在搭載AI加速器的CPU上運(yùn)行可以獲得非常好的能耗比與性?xún)r(jià)比,還能夠以極具優(yōu)勢(shì)的TCO滿(mǎn)足云廠(chǎng)商大多數(shù)AI服務(wù)的需求。同時(shí)CPU的通用計(jì)算能力也可以為云廠(chǎng)商提供充足的靈活性,有效保護(hù)基礎(chǔ)設(shè)施投資。

      面對(duì)上述需求,英特爾作為服務(wù)器CPU領(lǐng)域的技術(shù)領(lǐng)導(dǎo)者,繼年初發(fā)布第四代至強(qiáng)® 可擴(kuò)展處理器之后,加快了產(chǎn)品更新節(jié)奏,于上周發(fā)布了第五代至強(qiáng)® 可擴(kuò)展處理器,其可與上一代處理器兼容,提供硬件級(jí)安全和可信服務(wù),并通過(guò)豐富的AI產(chǎn)品組合駕馭整個(gè)AI管線(xiàn),從而進(jìn)一步壯大了應(yīng)對(duì)人工智能時(shí)代的產(chǎn)品組合。

      技術(shù)創(chuàng)新解決三大維度需求,CPU 繼續(xù)扮演 AI 時(shí)代基礎(chǔ)設(shè)施關(guān)鍵角色

      相比上一代產(chǎn)品,第五代至強(qiáng)® 可擴(kuò)展處理器的核心數(shù)量增加至64個(gè),擁有更高的單核性能和內(nèi)存帶寬,三級(jí)緩存容量提升近3倍。其每個(gè)內(nèi)核都具備AI加速功能,內(nèi)置的英特爾® AVX-512及英特爾® AMX,能使機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和大模型應(yīng)用的性能大幅提升。第五代至強(qiáng)® 可擴(kuò)展處理器還能通過(guò)英特爾® SGX/TDX為使用中的云端數(shù)據(jù)提供端到端硬件級(jí)防護(hù)能力。與上一代至強(qiáng)® 可擴(kuò)展處理器相比,五代至強(qiáng)® 在相同功耗下的平均性能提升了21%,而AI推理和訓(xùn)練性能的提升更是高達(dá)42%和29%。

      一系列技術(shù)創(chuàng)新,使第五代至強(qiáng)® 可擴(kuò)展處理器成為AI時(shí)代云廠(chǎng)商的基礎(chǔ)設(shè)施關(guān)鍵角色。目前,已經(jīng)有多家客戶(hù)在實(shí)際業(yè)務(wù)中部署了第五代至強(qiáng)® 可擴(kuò)展處理器,在實(shí)踐中證明了它為用戶(hù)帶來(lái)的巨大收益提升。其優(yōu)異的表現(xiàn)得到了客戶(hù)的很高評(píng)價(jià),也讓更多準(zhǔn)備升級(jí)云計(jì)算基礎(chǔ)設(shè)施的企業(yè)對(duì)新一代至強(qiáng)® 有了更高的期待。

      英特爾 AMX提升大模型推理性能,助力京東升級(jí)營(yíng)銷(xiāo)購(gòu)物體驗(yàn)

      2023 年京東云突破性地在數(shù)百個(gè)AI場(chǎng)景中應(yīng)用了大模型,在數(shù)百個(gè)營(yíng)銷(xiāo)場(chǎng)景中升級(jí)了原有工作流,顯著提升了商家與消費(fèi)者的購(gòu)物體驗(yàn)。

      基于自研的言犀AI與大模型,京東云通過(guò)AIGC管道生成了30%的大促物料,京小智數(shù)字人、領(lǐng)航者營(yíng)銷(xiāo)平臺(tái)也在大模型支持下獲得了高達(dá)87%的商品推薦采納率,消費(fèi)者應(yīng)答準(zhǔn)確率提升30%。

      京東大模型第一次亮相就收獲完美成績(jī),很大程度上要?dú)w功于其部署的基于第五代英特爾® 至強(qiáng)® 可擴(kuò)展處理器的新一代自研服務(wù)器,與上一代自研服務(wù)器相比整機(jī)性能提升23%,關(guān)鍵的AI CV推理性能與 Llama v2大模型推理性能更是分別提升38%與51%。

      取得如此顯著的AI推理能力進(jìn)步,秘訣在于第五代至強(qiáng)® 可擴(kuò)展處理器搭載的英特爾® AMX加速引擎。其可以將INT8低精度矩陣運(yùn)算速度提升一個(gè)數(shù)量級(jí),再結(jié)合第五代至強(qiáng)® 可擴(kuò)展處理器更高的內(nèi)存帶寬與更強(qiáng)的多核心互聯(lián)能力,使AI推理性能相較上一代顯著提升。在11.11大促中,第五代至強(qiáng)® 可擴(kuò)展處理器和英特爾® AMX的組合在京東云承載的 AI 推理應(yīng)用服務(wù)中大展身手,助力用戶(hù)訪(fǎng)問(wèn)峰值同比提升170%,智能客服咨詢(xún)服務(wù)量超14億次,且并未增加能耗,也將京東云基礎(chǔ)設(shè)施的運(yùn)維成本維護(hù)在之前的水平內(nèi)。

      英特爾®TDX賦能可信計(jì)算環(huán)境,阿里客戶(hù)構(gòu)筑端到端數(shù)據(jù)安全城墻

      對(duì)于云計(jì)算廠(chǎng)商而言,要讓更多行業(yè)和組織信任云服務(wù),就必須提供有足夠說(shuō)服力的安全隱私保障,所以云廠(chǎng)商迫切需要更高水準(zhǔn)的硬件級(jí)安全城墻。

      對(duì)于云環(huán)境中使用狀態(tài)中的數(shù)據(jù),機(jī)密計(jì)算是實(shí)現(xiàn)其有效保護(hù)的良策,其為客戶(hù)敏感數(shù)據(jù)提供了基于硬件設(shè)備的可信執(zhí)行環(huán)境(Trusted Execution Environment, TEE),通過(guò)隔離保護(hù)的方式來(lái)防止未經(jīng)授權(quán)的入侵者訪(fǎng)問(wèn)或修改處理中的數(shù)據(jù)。作為機(jī)密計(jì)算技術(shù)的重要引領(lǐng)者,英特爾® 軟件防護(hù)擴(kuò)展(英特爾® SGX)技術(shù)提供了應(yīng)用層面的隔離能力;而在和阿里云的合作中,則由英特爾® TDX技術(shù)與阿里云新實(shí)例搭載的可信平臺(tái)模塊(TPM)相配合,結(jié)合阿里云自研的加密計(jì)算隔離環(huán)境enclave,為阿里云第八代企業(yè)級(jí)ECS實(shí)例g8i構(gòu)建了一個(gè)基于虛擬化的硬件可信環(huán)境,即為整個(gè)虛擬化實(shí)例(包括虛擬機(jī)、容器)都構(gòu)建出可信的邊界,由此為客戶(hù)提供了可信邊界更大、更易部署的安全云環(huán)境。

      英特爾® TDX使TEE環(huán)境的可信邊界獲得了有效擴(kuò)展,從而讓IaaS、PaaS等環(huán)境中的云工作負(fù)載都能整體納入機(jī)密計(jì)算的數(shù)據(jù)保護(hù)之下,能夠有效抵御惡意威脅,加強(qiáng)云端數(shù)據(jù)隔離。

      阿里云自研的千問(wèn)大模型就得到了英特爾® TDX的充分保護(hù),實(shí)現(xiàn)模型數(shù)據(jù)端到端加密保護(hù)。英特爾® TDX技術(shù)為AI大模型這樣需要向云端傳輸大量數(shù)據(jù)的應(yīng)用場(chǎng)景鑄就了足夠牢固的安全保障,也為生成式AI應(yīng)用廣泛普及鋪平了信任道路。此外,在引入第五代至強(qiáng)® 可擴(kuò)展處理器之后,第八代企業(yè)級(jí)ECS實(shí)例在計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、安全等工作負(fù)載中的都得到了顯著提升,在數(shù)據(jù)庫(kù)、硬件加解密、AI應(yīng)用、音視頻等場(chǎng)景性能提升15%~25%不等。更重要的是,八代實(shí)例保持價(jià)格不變,使阿里云g8i實(shí)例可以用更小的性能開(kāi)銷(xiāo)保障用戶(hù)的數(shù)據(jù)高度安全性。

      第五代至強(qiáng)®可擴(kuò)展至強(qiáng)算力大升級(jí),支持火山引擎實(shí)現(xiàn)降本增效目標(biāo)

      火山引擎的大規(guī)模云原生基礎(chǔ)設(shè)施包含超過(guò)一百萬(wàn)臺(tái)服務(wù)器、上千萬(wàn)容器實(shí)例,管理數(shù)十EB級(jí)別存儲(chǔ)資源,需要應(yīng)對(duì)10 億+級(jí)QPS緩存峰值、10+TB/s的讀寫(xiě)峰值帶寬,支持?jǐn)?shù)億日活的應(yīng)用訪(fǎng)問(wèn)。

      為了應(yīng)對(duì)如此復(fù)雜的需求,火山引擎一直都選擇和信賴(lài)英特爾® 至強(qiáng)® 解決方案,并率先引入第五代至強(qiáng)® 可擴(kuò)展處理器,助其第三代彈性計(jì)算實(shí)例加碼全新升級(jí)。

      與基于第四代至強(qiáng)® 的彈性計(jì)算實(shí)例相比,第五代至強(qiáng)® 可擴(kuò)展處理器助力火山引擎釋放了巨大算力和性能紅利,其彈性計(jì)算實(shí)例整機(jī)算力提升39%,內(nèi)存帶寬提升17%,并在A(yíng)I、視頻處理性能、Java應(yīng)用性能等方面均有40%左右的性能提升。火山引擎計(jì)劃推出使用英特爾原生硬件加速技術(shù)的能力升級(jí),以Nginx為例,使用英特爾® QAT進(jìn)行數(shù)據(jù)壓縮和證書(shū)驗(yàn)證操作的吞吐量最高可提升5倍;在RocksDB中,使用英特爾® IAA進(jìn)行數(shù)據(jù)壓縮讀寫(xiě)的吞吐量最高可提升1.9倍。提升如此巨大的算力進(jìn)化幅度,使火山引擎能夠使用相同的實(shí)例數(shù)量應(yīng)對(duì)更多業(yè)務(wù)需求。

      如今,火山引擎正在構(gòu)建百萬(wàn)核心級(jí)別彈性資源池,為業(yè)務(wù)的流量增長(zhǎng)、體驗(yàn)創(chuàng)新與安全性增強(qiáng)提供海量算力保障。

      第五代至強(qiáng)® 可擴(kuò)展處理器提供澎湃的算力的同時(shí),還與上一代處理器兼容,共享架構(gòu)與平臺(tái),大大減少測(cè)試和驗(yàn)證工作,其更高的性能、更好的安全性、更高的成本效益,已經(jīng)在頭部云服務(wù)提供商中得到全面驗(yàn)證。

      軟硬結(jié)合,打通AI創(chuàng)新底層瓶頸

      除硬件方面的諸多創(chuàng)新,第五代至強(qiáng)® 可擴(kuò)展處理器在軟件層面也搭建了良好的生態(tài)環(huán)境。例如,英特爾已經(jīng)在Pytorch、Tensorflow和OpenVINO™ 工具套件等行業(yè)標(biāo)準(zhǔn)框架中提供了針對(duì)第五代至強(qiáng)® 可擴(kuò)展處理器的優(yōu)化,使得云廠(chǎng)商和用戶(hù)能夠以較低的門(mén)檻,快速利用如英特爾® AMX等處理器功能,打通AI應(yīng)用的算力瓶頸。英特爾® Trust Authority鑒證服務(wù)則能充分驗(yàn)證TEE的有效性,發(fā)揮英特爾® SGX/TDX技術(shù)的優(yōu)勢(shì)。

      如果說(shuō)數(shù)據(jù)中心是一臺(tái)巨型計(jì)算機(jī),那么CPU就是它的超級(jí)大腦,第五代英特爾® 至強(qiáng)® 可擴(kuò)展處理器將一如既往地扮演核心角色。它與網(wǎng)絡(luò)、GPU、軟件技術(shù)棧等其他英特爾創(chuàng)新技術(shù)一起共同構(gòu)筑了上層AI應(yīng)用的根基。而這樣的根基雖然能力強(qiáng)大,但并不需要用戶(hù)為此投入大量精力學(xué)習(xí)或增加運(yùn)維投入。由此,企業(yè)就能將主要精力投入在業(yè)務(wù)創(chuàng)新中,并在 AI 浪潮中緊緊把握住市場(chǎng)機(jī)遇,開(kāi)啟新的增長(zhǎng)路徑。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    [No. X058-2]
    分享到微信

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。