還能再漲23%!AI寵兒NVIDIA成大摩明年首選AMD FSR 4.0將與RX 9070 XT顯卡同步登場(chǎng)羅永浩細(xì)紅線最新進(jìn)展,暫別AR,迎來(lái)AI Jarvis構(gòu)建堅(jiān)實(shí)數(shù)據(jù)地基,南京打造可信數(shù)據(jù)空間引領(lǐng)數(shù)字城市建設(shè)下單前先比價(jià)不花冤枉錢(qián) 同款圖書(shū)京東價(jià)低于抖音6折日媒感慨中國(guó)電動(dòng)汽車(chē)/智駕遙遙領(lǐng)先:本田、日產(chǎn)、三菱合并也沒(méi)戲消委會(huì)吹風(fēng)機(jī)品質(zhì)檢測(cè)結(jié)果揭曉 徠芬獨(dú)占鰲頭 共話新質(zhì)營(yíng)銷(xiāo)力,2024梅花數(shù)據(jù)峰會(huì)圓滿落幕索尼影像專業(yè)服務(wù) PRO Support 升級(jí),成為會(huì)員至少需注冊(cè) 2 臺(tái) α 全畫(huà)幅相機(jī)、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競(jìng)賽:6500mAh 旗艦機(jī)+7500mAh中端機(jī)寶馬M8雙門(mén)轎跑車(chē)明年年初將停產(chǎn),后續(xù)無(wú)2026款車(chē)型比亞迪:2025 款漢家族車(chē)型城市領(lǐng)航智駕功能開(kāi)啟內(nèi)測(cè)雷神預(yù)告2025年首次出席CES 將發(fā)布三款不同技術(shù)原理智能眼鏡realme真我全球首發(fā)聯(lián)發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計(jì)劃iQOO Z9 Turbo長(zhǎng)續(xù)航版手機(jī)被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷(xiāo)量大跌:曝保時(shí)捷將重新評(píng)估電動(dòng)汽車(chē)計(jì)劃來(lái)京東參與榮耀Magic7 RSR 保時(shí)捷設(shè)計(jì)預(yù)售 享365天只換不修國(guó)補(bǔ)期間電視迎來(lái)?yè)Q機(jī)潮,最暢銷(xiāo)MiniLED品牌花落誰(shuí)家?美團(tuán)旗下微信社群團(tuán)購(gòu)業(yè)務(wù)“團(tuán)買(mǎi)買(mǎi)”宣布年底停運(yùn)消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機(jī)設(shè)備
  • 首頁(yè) > 企業(yè)IT頻道 > 人工智能

    云算力之外,一場(chǎng)始于AI的秘密戰(zhàn)爭(zhēng)

    2023年05月30日 16:01:54   來(lái)源:解碼Decode

      今年3月,面對(duì)洶涌而來(lái)的AI潮,“硅谷刀王”一改往日本色,主動(dòng)站到臺(tái)前,宣布推出DGX云,把AI專用的GPU放到云上「出租」。

      以往,出售算力這種事都是云計(jì)算公司在干。它們購(gòu)買(mǎi)多種型號(hào)顯卡與人工智能加速器,根據(jù)硬件性能或使用時(shí)長(zhǎng)等方式定價(jià),然后租給下游客戶。

      這個(gè)過(guò)程中,英偉達(dá)將GPU要么賣(mài)給云計(jì)算平臺(tái),要么直接出售給AI公司,比如第一臺(tái)NVIDIA DGX超級(jí)計(jì)算機(jī)就是2016年老黃親自交付給OpenAI的,并沒(méi)有直接出售算力,頂多算「賣(mài)鏟人」。

      而DGX上云這個(gè)事,雖然英偉達(dá)仍需要將其托管到云平臺(tái),但本質(zhì)上已經(jīng)是跨越邊界了。

      一向屈居幕后的英偉達(dá),這次為何要走向臺(tái)前?

      本輪AI潮英偉達(dá)毫無(wú)疑問(wèn)是最大的受益者,甚至可以沒(méi)有之一。

      用于訓(xùn)練AI的GPU芯片價(jià)格瘋長(zhǎng),海外A100和H100的每片價(jià)格分別漲到了1.5萬(wàn)美元和4萬(wàn)美元,國(guó)內(nèi)一臺(tái)配置8顆A100和80G存儲(chǔ)空間的AI服務(wù)器,價(jià)格也從去年中旬的8萬(wàn)/臺(tái)飆升至當(dāng)前的165萬(wàn)/臺(tái)。

      但這些錢(qián)并沒(méi)有都流入英偉達(dá)的口袋,溢價(jià)都被渠道拿走了,關(guān)鍵是這種倒買(mǎi)倒賣(mài)英偉達(dá)還一點(diǎn)辦法沒(méi)有。

      DGX云就在這種情況下應(yīng)運(yùn)而生,關(guān)鍵價(jià)格看似還很便宜。配備8個(gè)H100 GPU模組的DGX云,每月套餐費(fèi)只要3.7萬(wàn)美元,相當(dāng)于單片H100的價(jià)格。

      對(duì)于急需算力資金又捉襟見(jiàn)肘的AI公司來(lái)說(shuō),DGX云無(wú)疑是渴睡時(shí)天降的一個(gè)枕頭;對(duì)英偉達(dá)而言,出售云算力既能賺錢(qián)又綁定了客戶。

      而看似雙贏的背后,卻隱藏著一場(chǎng)始于AI的秘密戰(zhàn)爭(zhēng)。

      1

      算力平權(quán)

      從產(chǎn)業(yè)特點(diǎn)看,今天基于云算力的AIGC和曾經(jīng)的加密資產(chǎn)挖礦極其相似,但需要的資源遠(yuǎn)高于后者。

      國(guó)盛證券曾在《Web3 視角下的AIGC算力進(jìn)化論》中,比較了加密資產(chǎn)挖礦和AIGC產(chǎn)業(yè)的異同點(diǎn):

      1 AIGC產(chǎn)業(yè)耗電量大約會(huì)在1.6-7.5年間超過(guò)當(dāng)前比特幣挖礦產(chǎn)業(yè)耗電量,主要驅(qū)動(dòng)因素是GPT類(lèi)大語(yǔ)言模型在模型參數(shù)、日活和模型數(shù)量上的高速增長(zhǎng);

      2 和比特幣挖礦類(lèi)似,AIGC產(chǎn)業(yè)由算力驅(qū)動(dòng)的內(nèi)容處于高強(qiáng)度競(jìng)爭(zhēng)中,參與者只有持續(xù)、快速生產(chǎn)出高質(zhì)量?jī)?nèi)容,才能保證自己獲取到的用戶注意力不會(huì)下降。

      這就導(dǎo)致AIGC產(chǎn)業(yè)的兩大特點(diǎn):高成本和持續(xù)性。

      其中,成本側(cè)不止是耗電量,當(dāng)然耗電量可以作為一個(gè)非常直觀的證據(jù)。比如百度用于訓(xùn)練推理文心一言的陽(yáng)泉超算中心,每小時(shí)耗電64000kW·h(度),按照0.45元/kW·h的商業(yè)用電標(biāo)準(zhǔn),一年電費(fèi)就達(dá)到2.5億。

      而更大的成本則是來(lái)自算力投入。

      以ChatGPT為例,不考慮與日活高度相關(guān)推理過(guò)程所需的算力,僅考慮訓(xùn)練過(guò)程,根據(jù)測(cè)算,1750億參數(shù)的GPT-3訓(xùn)練一次大約需要6000張英偉達(dá)A100顯卡,如果考慮互聯(lián)損失,大約需要上萬(wàn)張A100。

      按單張A100芯片10萬(wàn)計(jì)算,大規(guī)模訓(xùn)練就需要投入約10億,一般廠商根本承擔(dān)不起。而GPT-4的模型參數(shù)更大,訓(xùn)練的標(biāo)識(shí)符更多,所需算力更為可觀。

      并且,隨著更多AIGC大模型的發(fā)布,其所需算力直線狂飆。

      根據(jù)OpenAI測(cè)算,自2012年至2018年,用于訓(xùn)練AI所需要的算力大約每隔3-4個(gè)月翻倍,總共增長(zhǎng)了30萬(wàn)倍(而摩爾定律在相同時(shí)間只有7倍的增長(zhǎng)), 每年頭部訓(xùn)練模型所需算力增長(zhǎng)幅度高達(dá)10倍,整體呈現(xiàn)指數(shù)級(jí)上漲。

      這個(gè)時(shí)候就體現(xiàn)出云算力的優(yōu)勢(shì)了,總結(jié)下來(lái)可以歸結(jié)為8個(gè)字:化整為零,按需付費(fèi)。

      云算力能讓AIGC大模型廠商無(wú)需購(gòu)買(mǎi)英偉達(dá)A100顯卡等硬件,而直接按需租用云算力平臺(tái)提供的算力,這使得初創(chuàng)企業(yè)或非頭部模型廠商也能?chē)L試進(jìn)入AIGC領(lǐng)域。

      甚至這種“化整為零”的方式,對(duì)產(chǎn)業(yè)鏈各方都有益處:

      1)對(duì)上游算力生產(chǎn)商而言,在算力硬件進(jìn)入淡季、庫(kù)存趨增時(shí),能通過(guò)售賣(mài)云算力的方式,平滑收入的波動(dòng),并為旺季儲(chǔ)備“有生”力量,及時(shí)滿足回彈的市場(chǎng)需求;

      2)對(duì)中游云服務(wù)廠商而言,則有助于增加客流;

      3) 對(duì)下游算力需求方而言,能最大化降低使用算力的門(mén)檻,驅(qū)動(dòng)全民AIGC 時(shí)代降臨。

      如果AIGC大模型廠商愿意讓渡更多資源,還可以更深入地與云平臺(tái)合作。這方面的典型案例是微軟云與OpenAI的合作,兩者的合作沒(méi)有停留在算力租用上,而深入到了股權(quán)與產(chǎn)品的融合。

      另外,在大模型競(jìng)賽中,除了顯性的硬件投入成本,還有一個(gè)隱形的時(shí)間成本。

      一般而言,大模型對(duì)于算力的需求分為兩個(gè)階段,一是訓(xùn)練出類(lèi)ChatGPT大模型的過(guò)程;二是將這個(gè)模型商業(yè)化的推理過(guò)程。

      而且這個(gè)過(guò)程越持續(xù)大模型就越好。所以現(xiàn)在再來(lái)看英偉達(dá)DGX云,就不難搞懂老黃干了一件什么事。

      用云的方式把用于AI訓(xùn)練的GPU價(jià)格打下來(lái),算力平權(quán)籠絡(luò)中小公司,再基于大模型訓(xùn)練的持續(xù)性因素綁定客戶,“硅谷刀王”一舉兩得。

      2

      受益的未必是英偉達(dá)

      從去年12月開(kāi)始,英偉達(dá)A100的價(jià)格5個(gè)月累計(jì)漲幅達(dá)到37.5%,同期A800價(jià)格累計(jì)漲幅也達(dá)到了20.0%。

      GPU價(jià)格暴漲無(wú)疑增加了AIGC訓(xùn)練大模型的門(mén)檻,但對(duì)于頭部廠商而言,漲多少價(jià)GPU都是要買(mǎi)的。但對(duì)于腰部公司來(lái)說(shuō),不漲價(jià)可能咬咬牙還能下單,一漲價(jià)就只能望GPU興嘆了,王慧文創(chuàng)業(yè)拿到的5000萬(wàn)美金融資,可能連訓(xùn)練所需的顯卡都買(mǎi)不全。

      所以,老黃在這個(gè)時(shí)候拿出DGX云,就像開(kāi)了一家豪車(chē)租賃公司,讓買(mǎi)不起的人也能租用。

      當(dāng)然,這背后英偉達(dá)的另一層考量,即搶在競(jìng)爭(zhēng)對(duì)手前面,綁定更多的中小客戶。

      本輪AI熱潮中除OpenAI外,最出圈的AI公司非Midjourney和Authropic莫屬了。前者是一款A(yù)I繪圖應(yīng)用,最近同QQ頻道合作開(kāi)啟了國(guó)內(nèi)業(yè)務(wù),后者的創(chuàng)始人則是出自O(shè)penAI,其對(duì)話機(jī)器人Claude直接對(duì)標(biāo)ChatGPT。

      這兩家公司有一個(gè)相同點(diǎn),就是都沒(méi)有購(gòu)買(mǎi)英偉達(dá)GPU搭建超算,而是使用Google的算力服務(wù)。

      該服務(wù)由一個(gè)集成4096塊TPU v4的超算系統(tǒng)提供,重點(diǎn)是Google自研。

      另外一家搞自研芯片的巨頭是本輪AI浪潮的引領(lǐng)者微軟,傳聞這款名叫Athena的芯片采用5nm先進(jìn)制程,由臺(tái)積電代工,研發(fā)團(tuán)隊(duì)人數(shù)已經(jīng)接近300人。

      很明顯,這款芯片目標(biāo)就是替代昂貴的A100/H100,給OpenAI提供算力引擎,并最終一定會(huì)通過(guò)微軟的Azure云服務(wù)來(lái)?yè)寠Z英偉達(dá)的蛋糕。

      除了云計(jì)算公司的背刺,英偉達(dá)的大客戶特斯拉也要自己?jiǎn)胃伞?/p>

      2021年8月,馬斯克就向外界展示了用3000塊自家D1芯片搭建的超算Dojo ExaPOD。其中D1芯片由臺(tái)積電代工,采用7nm工藝,3000塊D1芯片直接讓Dojo成為全球第五大算力規(guī)模的計(jì)算機(jī)。

      相較之下,受禁令影響的國(guó)內(nèi)公司雖也有替代計(jì)劃,但短期內(nèi)仍嚴(yán)重依賴英偉達(dá)。

      國(guó)產(chǎn)芯片可以做對(duì)信息顆粒度要求沒(méi)有那么高的云端推理工作,但大多目前無(wú)法處理超高算力需求的云端訓(xùn)練。

      燧原科技、壁仞科技、天數(shù)智芯、寒武紀(jì)等公司都推出了自己的云端產(chǎn)品,且理論性能指標(biāo)不弱。

      據(jù)此前曝光的信息,百度用于訓(xùn)練推理文心一言的陽(yáng)泉超算中心,除了A100還用了一些國(guó)產(chǎn)化的產(chǎn)品,比如百度自研的昆侖芯和寒武紀(jì)的思元590,其中有消息顯示2023年采購(gòu)計(jì)劃思元大概占10%-20%。

      其中,文心一言的芯片層核心能力來(lái)自昆侖芯2代AI芯片,其采用自研XPU-R架構(gòu)、7nm工藝和GDDR6高速顯存,通用性和性能顯著提升;具有256 TOPS@INT8和128 TFLOPS@FP16的算力水平,較一代提升2-3倍。

      今年3月,李彥宏也在亞布力中國(guó)企業(yè)家論壇上分享,昆侖芯片現(xiàn)在很適合做大模型的推理,將來(lái)會(huì)適合做訓(xùn)練。

      3

      尾聲

      從RIVA128開(kāi)始,英偉達(dá)就展示了自己驚人的市場(chǎng)觀察能力。過(guò)去的十幾年里,從加密貨幣挖礦到元宇宙,再到AI潮,英偉達(dá)順勢(shì)將顯卡的客戶從游戲玩家拓展到了科技巨頭。

      伴隨著戰(zhàn)火蔓延,英偉達(dá)市值也一路高歌,從一個(gè)二線芯片公司變成了全行業(yè)的No.1。只是,黃仁勛說(shuō)AI的iPhone時(shí)刻已到來(lái),那么諾基亞都被蘋(píng)果打敗,英偉達(dá)又怎能是無(wú)敵的呢。

      參考資料

      [1] AIGC的看多期權(quán):AI云算力,國(guó)盛證券

      [2] Web3 視角下的AIGC 算力進(jìn)化論,國(guó)盛證券

      [3] 英偉達(dá)帝國(guó)的一道裂縫,遠(yuǎn)川研究所

      [4] 云算力挖礦可能是現(xiàn)在入場(chǎng)比特幣最穩(wěn)的路,Odaily星球日?qǐng)?bào)

      [5] 百度“文心一言”專家解讀,獨(dú)角獸智庫(kù)

      [6] 大模型時(shí)代,國(guó)產(chǎn)GPU加速「狂飆」,數(shù)字時(shí)氪

      [7] 英偉達(dá)黃仁勛:將通過(guò)中國(guó)云服務(wù)商提供AI超算能力,AI的iPhone時(shí)刻到來(lái)! 第一財(cái)經(jīng)

      [8] AI算力產(chǎn)業(yè)鏈?zhǔn)崂恚杭夹g(shù)迭代推動(dòng)瓶頸突破,AIgc場(chǎng)景增多驅(qū)動(dòng)算力需求提升,安信證券

      免責(zé)聲明:本文基于已公開(kāi)的資料信息或受訪人提供的信息撰寫(xiě),但解碼Decode及文章作者不保證該等信息資料的完整性、準(zhǔn)確性。在任何情況下,本文中的信息或所表述的意見(jiàn)均不構(gòu)成對(duì)任何人的投資建議。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類(lèi)目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。