“我們需要的HBM(高帶寬存儲(chǔ)器)數(shù)量非常龐大,目前正在與三星、SK海力士和美光洽談,我們已經(jīng)收到這三家公司的產(chǎn)品。”說出這句話的,是英偉達(dá)的CEO黃仁勛。依靠GPU,英偉達(dá)如日中天,這讓全球排名前三的存儲(chǔ)芯片廠商爭(zhēng)相拋出橄欖枝。
當(dāng)前,生成式AI的浪潮洶涌而至,讓GPU大施拳腳,更是帶動(dòng)整個(gè)半導(dǎo)體產(chǎn)業(yè)鏈掀起了更新潮,成為了存儲(chǔ)市場(chǎng)的“救命稻草”,創(chuàng)下了在一個(gè)季度內(nèi)扭虧為盈的壯舉。而GPU帶動(dòng)的芯片產(chǎn)業(yè)還不只這些。
存儲(chǔ)芯片扭虧為盈的“救世主”
自2021年以來,存儲(chǔ)芯片產(chǎn)業(yè)進(jìn)入長(zhǎng)達(dá)近兩年的下行周期,這也導(dǎo)致存儲(chǔ)芯片廠商的利潤(rùn)持續(xù)走低,甚至一度陷入虧損狀態(tài),例如,2023年全年,三星綜合營(yíng)業(yè)利潤(rùn)為6.6萬億韓元,較上年同期下降84.86%。SK海力士則是累計(jì)營(yíng)業(yè)虧損為7.7303萬億韓元,凈虧損為9.1375萬億韓元。一直到2023年第四季度,兩大存儲(chǔ)廠商才逐漸恢復(fù)盈利能力。這個(gè)扭虧為盈的關(guān)鍵點(diǎn)正是GPU的爆發(fā)式增長(zhǎng)。
GPU在進(jìn)行大量數(shù)據(jù)處理時(shí),特別是在高性能計(jì)算、人工智能和圖形處理等領(lǐng)域,對(duì)存儲(chǔ)帶寬和容量的需求極高。GDDR(一種用于圖形處理器和高性能計(jì)算模塊的顯存類型)和HBM具有的高帶寬、低功耗和低延遲的特性,正是GPU所最需要的。各大存儲(chǔ)芯片企業(yè)紛紛開始研究這兩個(gè)存儲(chǔ)芯片品類。
芯謀研究企業(yè)服務(wù)部總監(jiān)王笑龍?jiān)诮邮堋吨袊?guó)電子報(bào)》記者采訪時(shí)表示,為滿足GPU對(duì)高帶寬的需求,HBM技術(shù)通過堆疊內(nèi)存芯片并利用硅中介層直接連接到GPU,大幅度提高了內(nèi)存帶寬。隨著GPU需求的增長(zhǎng),HBM2、HBM2E乃至最新的HBM3等迭代版本將不斷推出,進(jìn)一步提升了帶寬和容量,同時(shí)降低功耗。
在GPU市場(chǎng)需求引導(dǎo)下,各大存儲(chǔ)芯片企業(yè)的GDDR和HBM訂單拿到手軟。SK海力士近期表示,根據(jù)截至今年底的生產(chǎn)能力,目前已經(jīng)完成了對(duì)2025年HBM內(nèi)存產(chǎn)能的分配。三星也是不甘示弱,稱自身HBM訂單也已售罄,預(yù)估明年不會(huì)出現(xiàn)HBM內(nèi)存供過于求的情況。美光也表示,已經(jīng)基本完成了2025年的HBM內(nèi)存供應(yīng)談判,預(yù)計(jì)在2024年9月結(jié)束的本財(cái)年中,HBM內(nèi)存將帶來數(shù)億美元的營(yíng)收,而在2025財(cái)年,相關(guān)業(yè)務(wù)的銷售額預(yù)計(jì)將增加到數(shù)十億美元。
產(chǎn)能方面,HBM廠商為滿足HBM3E內(nèi)存需求,SK海力士計(jì)劃大幅增加1bnm制程DRAM內(nèi)存產(chǎn)能。目標(biāo)到今年年底將1bnm內(nèi)存晶圓投片量增至9萬片,明年上半年進(jìn)一步增加到14~15萬片。為此,SK海力士計(jì)劃將其位于京畿道利川市的M16內(nèi)存晶圓廠升級(jí)至1bnm工藝。而三星預(yù)計(jì)到2024年底,現(xiàn)有設(shè)施將全部使用完畢。新的P4L工廠計(jì)劃于2025年完工,而15號(hào)生產(chǎn)線工廠將從1Y納米工藝過渡到1bnm及以上工藝。
下一代技術(shù)方面,SK海力士計(jì)劃將HBM新產(chǎn)品的供應(yīng)周期從2年加快至1年。此外,還計(jì)劃在2025年和2026年完成HBM4(第6代)和HBM4E(第7代)的技術(shù)開發(fā)和量產(chǎn)。三星同樣表示,HBM4內(nèi)存計(jì)劃于明年完成開發(fā),2026年實(shí)現(xiàn)量產(chǎn)。而美光已經(jīng)開始出樣12層堆疊的HBM3E內(nèi)存,預(yù)計(jì)這將成為2025年業(yè)績(jī)的重要驅(qū)動(dòng)力。
據(jù)Mordor Intelligence預(yù)測(cè),從2024年到2029年,HBM市場(chǎng)規(guī)模預(yù)計(jì)將從約25.2億美元激增至79.5億美元,預(yù)測(cè)期內(nèi)復(fù)合年增長(zhǎng)率高達(dá)25.86%。
池憲念表示:“不只是GDDR和HBM,為了應(yīng)對(duì)GPU持續(xù)飆升的存儲(chǔ)需求,各大企業(yè)也在探索新型的存儲(chǔ)介質(zhì)。例如,業(yè)界已經(jīng)開始探索如3D XPoint、ReRAM(電阻式隨機(jī)存取存儲(chǔ)器)、PCM(相變存儲(chǔ))等新型非易失性存儲(chǔ)技術(shù),它們有望提供接近DRAM的性能,同時(shí)保持?jǐn)?shù)據(jù)持久性,適合于GPU密集型應(yīng)用中的快速存儲(chǔ)和交換數(shù)據(jù)。”
CPU與GPU齊頭并進(jìn)深度融合
在此前的臺(tái)北電腦展上,英偉達(dá)、AMD、英特爾的首席執(zhí)行官的演講句句都離不開GPU,“明爭(zhēng)暗斗”地發(fā)布了關(guān)于CPU與GPU協(xié)同的最新解決方案,性能增量一個(gè)比一個(gè)驚人,可見GPU對(duì)于CPU的提升作用。
CPU是中央處理器,負(fù)責(zé)程序控制、順序執(zhí)行等操作,是信息處理、程序運(yùn)行的最終執(zhí)行單元。而GPU是圖形處理器,加入系統(tǒng)之后,GPU可以在CPU的控制下協(xié)同工作,分擔(dān)部分原本由CPU負(fù)責(zé)的工作,尤其是在圖形渲染、3D圖形加速以及大規(guī)模并行計(jì)算等需要處理大量數(shù)據(jù)的領(lǐng)域表現(xiàn)出色。這使得CPU可以將更多的資源用于執(zhí)行其他任務(wù),提高了系統(tǒng)的整體性能。因此,如何促進(jìn)CPU與GPU進(jìn)一步協(xié)同工作,提升系統(tǒng)整體性能和效率就成為了各大CPU企業(yè)所重點(diǎn)關(guān)注的課題。
為此,英偉達(dá)、AMD、英特爾等國(guó)內(nèi)外領(lǐng)軍企業(yè)想到的第一個(gè)辦法是開發(fā)CPU與GPU的異構(gòu)計(jì)算平臺(tái)。通過開發(fā)如NVLink、CCIX、CXL和Gen-Z等高速互連技術(shù),加強(qiáng)CPU與GPU之間的數(shù)據(jù)傳輸速度和效率,使得兩者能更緊密、高效地協(xié)同工作。
例如,黃仁勛提出,英偉達(dá)將在2026年推出最新的Vera CPU和Rubin GPU,并組成Vera Rubin超級(jí)芯片,有望取代現(xiàn)有的Grace Hopper超級(jí)芯片。此外,Rubin平臺(tái)還將搭載新一代NVLink 6 Switch,提供高達(dá)3600 GB/s的連接速度,以及高達(dá)1600 GB/s的CX9 SuperNIC組件,確保數(shù)據(jù)傳輸?shù)母咝浴?/p>
除了建立異構(gòu)計(jì)算平臺(tái),半導(dǎo)體行業(yè)專家池憲念表示,還要優(yōu)化軟件與編程模型。為了解決CPU與GPU之間的通信瓶頸,企業(yè)投入資源開發(fā)了新的編程模型和庫,如CUDA、OpenCL、DirectX、Vulkan、oneAPI等,使得開發(fā)者能夠更便捷地編寫跨CPU和GPU的并行程序,充分利用兩者的計(jì)算優(yōu)勢(shì)。在某些應(yīng)用場(chǎng)景下,企業(yè)還可以集成特定的硬件加速器(如AI加速器、網(wǎng)絡(luò)加速器)與CPU和GPU一起工作,以實(shí)現(xiàn)特定任務(wù)的極致加速,滿足云計(jì)算、邊緣計(jì)算、數(shù)據(jù)中心等領(lǐng)域的特定需求。
此外推進(jìn)系統(tǒng)架構(gòu)的創(chuàng)新也是關(guān)鍵環(huán)節(jié),例如AMD推出的APU(加速處理器),將CPU與GPU集成在同一塊芯片上,實(shí)現(xiàn)了更緊密的集成和更低的延遲,為輕量級(jí)計(jì)算任務(wù)提供高效解決方案。英偉達(dá)也發(fā)明了一種新架構(gòu),將GPU與CPU相結(jié)合,兩個(gè)處理器能獨(dú)立且自主地運(yùn)行?梢宰屧拘枰100個(gè)時(shí)間單位才能完成的任務(wù),現(xiàn)在可能僅需1個(gè)時(shí)間單位即可完成。并且,這種架構(gòu)可以實(shí)現(xiàn)高達(dá)100倍的加速計(jì)算,而功率僅增加約3倍,每瓦性能比單獨(dú)使用CPU提高25倍,成本僅上升約50%。此外,RISC-V架構(gòu)也在探索包括CPU與GPU核心的一體化設(shè)計(jì),有望在性能和能效上取得新突破。
全產(chǎn)業(yè)鏈因GPU不斷創(chuàng)新
對(duì)于最上游的半導(dǎo)體設(shè)備、散熱技術(shù),以及后道封裝技術(shù)等方面的更新迭代來說,GPU的市場(chǎng)需求同樣成為了關(guān)鍵助推力。
半導(dǎo)體設(shè)備方面,英偉達(dá)之前發(fā)布了可以將計(jì)算光刻變得更“聰明”的新光刻技術(shù)cuLitho,以前的計(jì)算光刻依賴CPU服務(wù)器集群,而如今,cuLitho可以實(shí)現(xiàn)在500套DGX H100(包含4000顆Hopper GPU)完成與4萬顆CPU運(yùn)算服務(wù)器相同的工作量,但速度快40倍,功耗低9倍。可見,GPU加速后,生產(chǎn)光掩模的計(jì)算光刻工作用時(shí)可以從兩周減少到八小時(shí)。臺(tái)積電可以通過在500個(gè)DGX H100系統(tǒng)上使用cuLitho加速,將功率從35MW降至5MW,從而替代用于計(jì)算光刻的4萬臺(tái)CPU服務(wù)器。黃仁勛表示,英偉達(dá)將繼續(xù)與臺(tái)積電、ASML和Synopsys合作,將先進(jìn)制程推進(jìn)到2納米及更高精度制程。
在散熱技術(shù)創(chuàng)新方面,英偉達(dá)決定在新發(fā)布的GPU產(chǎn)品B100上采用液冷散熱方案。黃仁勛曾公開表示,液冷技術(shù)是未來散熱技術(shù)的方向,有望引領(lǐng)整個(gè)散熱市場(chǎng)迎來全面的革新。
液冷散熱技術(shù)相較于傳統(tǒng)的風(fēng)冷散熱技術(shù),具有更高的散熱效率、更低的能耗、更低的噪聲。而隨著AI算力和功耗的不斷提升,當(dāng)單顆高算力芯片功率達(dá)到1000W時(shí),現(xiàn)有散熱技術(shù)將面臨革命性的變革,而液冷方案幾乎成為必選項(xiàng)。
民生證券表示,AI產(chǎn)業(yè)快速發(fā)展,驅(qū)動(dòng)液冷服務(wù)器滲透率逐步抬升。從發(fā)展趨勢(shì)來看,預(yù)計(jì)到2025年液冷服務(wù)器滲透率大約保持在20%-30%的水平。
池憲念表示,封裝技術(shù)也能夠提升GPU的各項(xiàng)性能,例如通過倒裝芯片封裝(FCBGA)的應(yīng)用,改善關(guān)鍵部件如CPU、GPU的散熱水平,提高信號(hào)傳輸速度和電氣性能;扇出型晶圓級(jí)封裝(FOWLP)能在相同封裝尺寸內(nèi)容納更多存儲(chǔ)芯片,提高帶寬,同時(shí)減小GPU的實(shí)際尺寸或騰出空間用于其他組件,這對(duì)于提升GPU的集成度和性能至關(guān)重要;CoWoS-L封裝技術(shù)允許在單一封裝中集成多個(gè)芯片(如GPU、HBM等),通過硅中介層實(shí)現(xiàn)高速互連,不僅提升了性能,也優(yōu)化了散熱路徑。同時(shí),GPU制造商正探索3D封裝技術(shù),通過堆疊多個(gè)芯片或Chiplet(小芯片)來構(gòu)建系統(tǒng),這樣不僅可以增加功能,還能通過縮短信號(hào)路徑來降低功耗并提高散熱效率。
總體來看,GPU的高速發(fā)展已成為半導(dǎo)體產(chǎn)業(yè)的重要驅(qū)動(dòng)力之一,它不僅推動(dòng)了半導(dǎo)體設(shè)計(jì)和制造技術(shù)的持續(xù)創(chuàng)新,還帶動(dòng)了整個(gè)產(chǎn)業(yè)鏈的協(xié)同發(fā)展,促使半導(dǎo)體廠商加大投入,提升產(chǎn)能,優(yōu)化工藝,以滿足日益增長(zhǎng)的GPU需求,也為整個(gè)科技行業(yè)帶來了更加廣闊的創(chuàng)新空間和發(fā)展機(jī)遇。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。