還能再漲23%!AI寵兒NVIDIA成大摩明年首選AMD FSR 4.0將與RX 9070 XT顯卡同步登場羅永浩細(xì)紅線最新進(jìn)展,暫別AR,迎來AI Jarvis構(gòu)建堅(jiān)實(shí)數(shù)據(jù)地基,南京打造可信數(shù)據(jù)空間引領(lǐng)數(shù)字城市建設(shè)下單前先比價(jià)不花冤枉錢 同款圖書京東價(jià)低于抖音6折日媒感慨中國電動(dòng)汽車/智駕遙遙領(lǐng)先:本田、日產(chǎn)、三菱合并也沒戲消委會(huì)吹風(fēng)機(jī)品質(zhì)檢測結(jié)果揭曉 徠芬獨(dú)占鰲頭 共話新質(zhì)營銷力,2024梅花數(shù)據(jù)峰會(huì)圓滿落幕索尼影像專業(yè)服務(wù) PRO Support 升級(jí),成為會(huì)員至少需注冊(cè) 2 臺(tái) α 全畫幅相機(jī)、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競賽:6500mAh 旗艦機(jī)+7500mAh中端機(jī)寶馬M8雙門轎跑車明年年初將停產(chǎn),后續(xù)無2026款車型比亞迪:2025 款漢家族車型城市領(lǐng)航智駕功能開啟內(nèi)測雷神預(yù)告2025年首次出席CES 將發(fā)布三款不同技術(shù)原理智能眼鏡realme真我全球首發(fā)聯(lián)發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計(jì)劃iQOO Z9 Turbo長續(xù)航版手機(jī)被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷量大跌:曝保時(shí)捷將重新評(píng)估電動(dòng)汽車計(jì)劃來京東參與榮耀Magic7 RSR 保時(shí)捷設(shè)計(jì)預(yù)售 享365天只換不修國補(bǔ)期間電視迎來換機(jī)潮,最暢銷MiniLED品牌花落誰家?美團(tuán)旗下微信社群團(tuán)購業(yè)務(wù)“團(tuán)買買”宣布年底停運(yùn)消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機(jī)設(shè)備
  • AI芯片短缺即將到來

    2023年05月09日 14:54:23   來源:微信公眾號(hào):半導(dǎo)體產(chǎn)業(yè)縱橫

      坊間曾傳出一份報(bào)告,報(bào)告稱今年年初百度緊急下單了3000臺(tái)包含8張芯片的A800服務(wù)器(相當(dāng)于2.4萬張A800芯片),預(yù)計(jì)全年會(huì)有A800和H800共5萬枚需求。無獨(dú)有偶,阿里云預(yù)計(jì)也將在今年一萬枚左右芯片,其中6000枚是H800。

      有知情人士透露,A800、H800芯片目前正遭到包括服務(wù)器、互聯(lián)網(wǎng)廠商的國內(nèi)公司“哄搶”,“H800國內(nèi)開始出貨了,但本來產(chǎn)量也不多。A800國內(nèi)今年一年出貨的量,超過一半在互聯(lián)網(wǎng)公司,”該知情人士稱,“H800出貨更少,剩下客戶新訂的可能最快要到12月才能交付。”

      在這一輪由Chat GPT掀起的大模型創(chuàng)業(yè)潮里,AI芯片成了搶手貨,其中GPU最為明顯。

      01 *的“硬通貨”

      隨著現(xiàn)象級(jí)AI產(chǎn)品Chat GPT的走紅,以大型語言模型為代表的前沿AI技術(shù)走向聚光燈之下。不少相關(guān)企業(yè)都接連推出了自己的大模型,百度、阿里、360、商湯等國內(nèi)企業(yè)紛紛宣布入局AI大模型。

      在技術(shù)架構(gòu)層面,AI芯片可分為GPU(圖形處理器)、ASIC(專業(yè)集成電路)、FPGA(現(xiàn)場可編程門陣列)和類腦芯片。Chat GPT背后的算力支撐主要來自GPU或CPU+FPGA。由于具備并行計(jì)算能力,可兼容訓(xùn)練和推理,GPU目前被廣泛應(yīng)用。

      大模型對(duì)于GPU的要求極高。一方面是對(duì)于GPU的數(shù)量有要求。根據(jù)Semianalysis的測算,Chat GPT每天在計(jì)算硬件成本方面的運(yùn)營成本為69萬美元。Open AI需要約3,617臺(tái)HGX A100服務(wù)器(2.8萬個(gè)GPU)來為Chat GPT提供服務(wù)。

      另一方面,對(duì)于GPU自身的性能也有要求。黃仁勛在一次會(huì)議上表示:“當(dāng)前*可以實(shí)際處理Chat GPT的GPU是英偉達(dá)HGX A100。”A100由540億個(gè)晶體管組成,打包了第三代Tensor核心,并具有針對(duì)稀疏矩陣運(yùn)算的加速功能,對(duì)于AI推理和訓(xùn)練來說特別有用。此后,英偉達(dá)還推出A100的替代者——H100,該芯片由臺(tái)積電5nm定制版本制程(4N)打造,單塊芯片包含800億晶體管,一舉成為最強(qiáng)。

      一時(shí)間,GPU成為了各大企業(yè)走向AI時(shí)代的*“硬通貨”。

      除了前文提到的國內(nèi)兩家巨頭企業(yè)在購買GPU外,4月14日,國內(nèi)第四大云廠商騰訊宣布推出新一代的高性能計(jì)算集群,該集群采用騰訊云自研服務(wù)器,搭載了英偉達(dá)最新的中國*版GPU H800,服務(wù)器間的連接帶寬高達(dá)3.2Tbps。騰訊稱,該服務(wù)器集群算力性能較前代提高了3倍,將騰訊自研的“混元NLP大模型”訓(xùn)練時(shí)間由11天縮短至4天。

      隨著國內(nèi)大模型不斷推出,GPU的數(shù)量還遠(yuǎn)遠(yuǎn)不夠滿足。據(jù)前人工智能NLP企業(yè)首席科學(xué)家、千芯科技董事長陳巍測算,國內(nèi)如果想要直接訓(xùn)練出一個(gè)GPT-3級(jí)別的大模型,最少需要3000到5000枚A100級(jí)別的AI芯片。以保守情況估計(jì),目前國內(nèi)A100級(jí)別的AI芯片缺口在30萬枚左右。

      “瘋狂”購買的不止是國內(nèi)企業(yè),海外巨頭也在搶購。

      2022年11月發(fā)布Chat GPT-3之后,Open AI背后的金主微軟表示,已經(jīng)購買了超過一萬枚英偉達(dá)A100 GPU芯片,為Chat GPT構(gòu)建AI計(jì)算集群。前不久,馬斯克也為了推進(jìn)推特內(nèi)部的新AIGC項(xiàng)目,直接購買了約1萬個(gè)GPU。

      不過,地主家的存糧也不多,據(jù)消息人士透露,從2022年末,微軟就實(shí)行了GPU資源配額供給,但今年1月以來審批時(shí)間越來越長,如今部分申請(qǐng)需要等待幾天甚至幾周才能獲批。同時(shí),微軟向英偉達(dá)預(yù)訂的數(shù)萬枚GPU芯片,交貨無期。

      02 GPU價(jià)格攀升

      如此巨大的需求,推動(dòng)著本就昂貴的GPU價(jià)格再度上漲。

      截止5月5日,英偉達(dá)最新發(fā)布的旗艦AI芯片H100在ebay上的售價(jià)達(dá)到4萬美元一枚。記者搜索eBay時(shí)發(fā)現(xiàn),目前共有6家店鋪掛牌銷售H100芯片,其售價(jià)普遍達(dá)到4.5萬美元左右。相較于之前零售商報(bào)價(jià)的3.6萬美元,提價(jià)明顯。

      國內(nèi)方面,AI應(yīng)用的主力芯片——由英偉達(dá)2020年發(fā)布的A100,價(jià)格也在飛速飆升。從年初到現(xiàn)在的5個(gè)月內(nèi),A100的價(jià)格從原來的6萬元一路飆升到10萬元,漲幅超過50%。業(yè)內(nèi)人士預(yù)測由于美國的禁令,國內(nèi)相關(guān)芯片的價(jià)格將持續(xù)上漲。

      去年年底,英偉達(dá)推出A100“閹割版”(帶寬被限制)——A800顯卡,價(jià)格也在同步上漲。記者了解到目前A800在京東官網(wǎng)的定價(jià)為89999元。但實(shí)際上A800現(xiàn)在處于“有價(jià)無市”的情況,供應(yīng)緊張,真實(shí)成交價(jià)格高于平臺(tái)報(bào)價(jià)。

      即便按89999元一顆A800芯片的價(jià)格計(jì)算,1萬顆的成本就是約人民幣9億元。A800目前在浪潮、新華三等國內(nèi)服務(wù)器廠商手中是稀缺品,一次只能采購數(shù)百片。有業(yè)內(nèi)人士感嘆:“一天一個(gè)價(jià),一天比一天貴。”

      《芯片戰(zhàn)爭》的作者Chris Miller在接受采訪時(shí)也做出預(yù)測:“對(duì)于用于AI的特定類型的芯片,實(shí)際上已經(jīng)出現(xiàn)了繁榮和一些已經(jīng)變得明顯的短缺。而且似乎對(duì)這些類型芯片的需求只會(huì)增長。”

      03 代工產(chǎn)能堪憂

      英偉達(dá)已經(jīng)供不上貨了。

      作為最強(qiáng)GPU,英偉達(dá)自然選擇了擁有全球*進(jìn)制程的臺(tái)積電進(jìn)行*代工。具體來看,英偉達(dá)的A100、A800采用的是臺(tái)積電7nm工藝、H100則是由臺(tái)積電5nm定制版(4N)打造。

      今年3月,臺(tái)積電收到了英偉達(dá)增加的代工訂單,其產(chǎn)品就是A100、H100,并且也包括為國內(nèi)市場設(shè)計(jì)的A800系列GPU的代工訂單。

      在5nm-7nm制程這塊,原本今年臺(tái)積電的產(chǎn)能利用率并不算高點(diǎn)。5nm方面,去年四季度臺(tái)積電就面臨多家客戶消減訂單;7nm方面,臺(tái)積電也預(yù)測在今年上半年不再處于過去3年的高點(diǎn)。

      現(xiàn)實(shí)情況卻出乎意料,Chat GPT的火熱帶來的不僅僅是對(duì)于英偉達(dá)訂單的需求,同樣也助力了AMD等企業(yè)。業(yè)內(nèi)人士表示,AMD也獲得了不少客戶的急單需求,并且已經(jīng)向臺(tái)積電加大了訂單量,其產(chǎn)品制程同樣覆蓋5nm和7nm家族。

      臺(tái)積電先進(jìn)制程的份額中,各家占比不同。根據(jù)日本精密加工研究所所長湯之上隆的預(yù)測,2022年的排名依次為:蘋果(25.4%)、AMD(9.2%)、聯(lián)發(fā)科(8.2%)、Broadcom(8.1%)、高通(7.6%)、英特爾(7.2%)、英偉達(dá)(5.8%)。可以看到,英偉達(dá)僅在第七。并且占據(jù)臺(tái)積電25.4%營收的蘋果,更是壟斷了臺(tái)積電80-90%的尖端制程。

      隨著去年年底,特斯拉大量訂購了臺(tái)積電的4nm/5nm制程訂單,想將其用于全自動(dòng)駕駛汽車。巨大的訂單量,使得特斯拉一躍拉成為臺(tái)積電的第七大客戶,英偉達(dá)順次排到了第八。

      在前七大客戶的訂單沖擊下,英偉達(dá)的訂單不免也將受到擠壓。

      并且,遠(yuǎn)水救不了近火,芯片代工本來就需要較長時(shí)間。去年8月,受到美國禁令的影響,英偉達(dá)直接對(duì)臺(tái)積電下了“超級(jí)急件(super hot runs)”訂單。這批“超級(jí)急件”總量約5000片,交期將大幅縮短,從原本預(yù)估的5至6個(gè)月,壓縮為2至3個(gè)月,最快10月底至11月初開始交貨。

      由此來看,即使英偉達(dá)現(xiàn)在下單臺(tái)積電,正常情況下GPU的量產(chǎn)仍需要一段時(shí)間。

      04 吊死在英偉達(dá)一棵樹上?

      業(yè)內(nèi)有人甚至以2021年席卷全球的缺芯潮,來類比眼下的GPU短缺:成千上萬的AI初創(chuàng)公司、甚至是大型云服務(wù)商,將如當(dāng)年因缺少關(guān)鍵芯片而停產(chǎn)的車企,或因缺少GPU面臨相似困境。

      不過,也并非所有客戶都“吊死在英偉達(dá)一棵樹上”,很多人將目標(biāo)光投向了英偉達(dá)的競爭對(duì)手,比如AMD的GPU、Cerebras的WSE,Cerebras表示自家WSE-2是”地球上最快的”AI處理器”。

      今年1月,AMD預(yù)告了重磅產(chǎn)品AMD Instinct MI300,MI300被稱為“世界上*款在數(shù)據(jù)中心集成的CPU+GPU”,MI300加速器專為*的高性能計(jì)算(HPC)和AI性能而設(shè)計(jì),借助3D封裝技術(shù)將CPU和加速計(jì)算單元集成在一起,總共有1460億個(gè)晶體管,預(yù)計(jì)在今年問世。蘇姿豐表示,該芯片可以將推理建模過程的時(shí)間從幾個(gè)月縮短至幾周。

      據(jù)了解,大約在5年前,微軟就開始研發(fā)一種芯片,內(nèi)部代號(hào)「雅典娜」(Athena),300人共同研發(fā),專為訓(xùn)練大型語言模型(LLM)而設(shè)計(jì)。如果順利,微軟將通過Athena將每顆芯片成本降低三分之一,從而為Chat GPT發(fā)展提供重要?jiǎng)恿Α?/p>

      與此同時(shí),英特爾也率先掀起了GPU價(jià)格戰(zhàn)。J.Gold Associates分析師Jack Gold表示,英特爾的GPU定價(jià)“相當(dāng)激進(jìn),尤其是一些低端產(chǎn)品”;一些超大規(guī)模的廠商很有可能會(huì)向自家客戶提供英特爾的高端GPU。

      值得注意的是,面對(duì)眾多大模型的算力需求,黃仁勛在2023年3月宣布英偉達(dá)將開展一項(xiàng)新的云租賃服務(wù)——向B端租賃用于開發(fā)Chat GPT等人工智能技術(shù)的超級(jí)計(jì)算機(jī)。

      不過,此舉看似開源,實(shí)則價(jià)格不菲——租賃這種包含8個(gè)A100或H100旗艦芯片的價(jià)格為3.7萬美元/月,約合人民幣25.4萬元。

      如此來看,AI仍舊是富人的游戲。

     

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。