" />
IDC:2024年全球PC出貨量同比增長1%,聯(lián)想、惠普、戴爾份額前三群創(chuàng)展出 9.6 英寸 Micro LED“智慧鏡面”顯示器零跑汽車 2025 年產(chǎn)品規(guī)劃曝光,B01轎車計劃7月上市微軟宣布 Teams Rooms 設(shè)備 10月14日終止支持 Win10英偉達迷你超算遭友商嘲諷:宣傳 FP4 算力,實際“不如買個游戲電腦”華碩披露 AMD Radeon RX 9070 XT / 9070 顯卡部分規(guī)格:配 16GB 顯存、需搭 750W 電源華擎首發(fā) RX 9070 Challenger / Steel Legend 顯卡情系災區(qū),共克時艱!雅迪火速馳援西藏,詮釋民族企業(yè)擔當AIGC領(lǐng)域新進展:北航副教授于茜在智能矢量圖生成上的探索AI醫(yī)療新紀元:復旦王爍研究員引領(lǐng)多模態(tài)醫(yī)學人工智能技術(shù)革新2025,一場文旅行業(yè)的大變革正在醞釀電視進入百吋時代,誰登頂,誰出局?OPPO掉隊淪為others:陳明永如何當好段永平“最好的徒弟”?vivo沒有個人英雄主義通義萬相首創(chuàng)生成漢字視頻,全面進化稱霸VBench!AI視頻GPT-3時刻來臨CES 2025 | 天馬全新一代智慧座艙,來了!追覓科技獲海外權(quán)威媒體盛贊,多項首創(chuàng)技術(shù)在CES 2025大放異彩三星Galaxy S25 Slim跑分首曝:驍龍8Elite超頻版穩(wěn)了小紅書新做的這個AI搜索,有Perplexity們都眼饞的能力消息稱京東App正進行大改版,突出新品和秒送業(yè)務
  • 首頁 > 數(shù)據(jù)存儲頻道 > 數(shù)據(jù).存儲頻道 > 半導體

    國產(chǎn)AI芯片迎高光時刻

    2025年01月10日 10:40:26   來源:微信公眾號:半導體產(chǎn)業(yè)縱橫

      GPU萬卡集群,小米下場了!摩爾線程智算集群擴展至萬卡!中國移動將商用三個自主可控萬卡集群......一系列標題的襲來,讓筆者突然意識到,仿佛在不經(jīng)意間,智能算力建設(shè)已然邁入萬卡時代。

      那么到底什么是萬卡集群?萬卡集群到底有哪些作用?有必要部署萬卡集群嗎?

      什么是萬卡集群?

      萬卡集群,是指由超過一萬張加速卡(如GPU、TPU或其他專用AI加速芯片)組成的高性能計算系統(tǒng),用以加速人工智能模型的訓練和推理過程。

      至于為什么需要一萬張加速卡?

      眾所周知,大模型競賽的本質(zhì)是算力競賽。比如這里有一個超大土堆,放一個工人和放一萬個工人,在效率上肯定會有質(zhì)的飛躍。

      以O(shè)penAI訓練GPT模型為例,GPT-4需要使用2.5萬張英偉達A100 GPU,并行訓練100天左右的時間,在此期間要處理13萬億個token,并且涉及大約1.76萬億個參數(shù)。在不久的將來,開發(fā)大模型所需的算力將實現(xiàn)指數(shù)級的增長,對于即將亮相的GPT-5,預計該模型的訓練需要部署20萬~30萬個*** GPU,耗時130~200 天。

      如今OpenAI發(fā)布ChatGPT已有兩年的時間,從建設(shè)進度上看,海外頭部廠商在2022年、2023年已經(jīng)完成萬卡集群搭建。比如2023年5月,谷歌推出的AI超級計算機A3,搭載了約26000塊英偉達*** GPU;2022年,META宣布了一個由1.6萬塊英偉達A100 GPU組成的集群。到了2024年初,META進一步擴大規(guī)模,建成了兩個各含24576塊GPU的集群,并設(shè)定了宏偉目標:到2024年底,構(gòu)建一個包含35萬塊英偉達*** GPU的龐大基礎(chǔ)設(shè)施。亞馬遜AmazonEC2 Ultra集群采用了2萬個*** TensorCore GPU。

      再看中國的智能算力建設(shè)情況。

      國產(chǎn)萬卡集群,誰在布局?

      日前,中國工程院院士鄭緯民指出,“構(gòu)建國產(chǎn)AI卡的萬卡大模型訓練平臺很難,但也很重要以及必要。”

      當下,國內(nèi)已有多家廠商及機構(gòu)著手向萬卡集群領(lǐng)域拓展業(yè)務。

      根據(jù)《智算產(chǎn)業(yè)發(fā)展研究報告(2024)》顯示,在中國,超萬卡集群的智算中心已達十余個。

      今年以來, 中國移動 、聯(lián)通、電信三大運營商均在加速推進超萬卡集群智算中心的建設(shè)。

      今年8月,中國電信在智算網(wǎng)絡建設(shè)方面取得了顯著進展,其上海與北京兩大萬卡集群已成功投產(chǎn)運營。

      中國移動位于呼和浩特、哈爾濱、貴陽的萬卡級別的智算中心已經(jīng)先后投產(chǎn)運行。據(jù)悉,三大集群總規(guī)模近6萬張GPU卡,充分滿足大模型集中訓練需求。

      中國聯(lián)通正在打造上海、呼和萬卡智算集群,全網(wǎng)智算算力超15EFLOPS,發(fā)布AICC、AICP、星羅調(diào)度平臺等五大智算產(chǎn)品,提供涵蓋國家“東數(shù)西算”樞紐、31省重點城市、超600邊緣節(jié)點的AIDC基座。

      小米也正計劃建設(shè)一座GPU萬卡集群。據(jù)悉,小米在其大模型團隊成立時已經(jīng)擁有6500張GPU資源。

      字節(jié)在2023年就已建立起超過1萬張卡的Ampere架構(gòu)GPU (A100/A800) 集群,此后還在建設(shè)大規(guī)模Hopper架構(gòu)(***/H800)集群。

      如今,“萬卡集群”被業(yè)界視作是這一輪大模型競賽的“入場券”,甚至還有不少廠商已經(jīng)開始布局“十萬卡集群”。

      百度的百舸 4.0 通過一系列產(chǎn)品技術(shù)創(chuàng)新,已經(jīng)能夠?qū)崿F(xiàn)十萬卡集群的高效管理。

      阿里巴巴的阿里云可實現(xiàn)芯片、服務器、數(shù)據(jù)中心之間的高效協(xié)同,支持 10 萬卡量級的集群可擴展規(guī)模,已服務全國一半的人工智能大模型企業(yè)。

      騰訊已宣布自研星脈高性能計算網(wǎng)絡全面升級,星脈網(wǎng)絡 2.0 搭載全自研的網(wǎng)絡設(shè)備與 AI 算力網(wǎng)卡,能夠支持超 10 萬卡大規(guī)模組網(wǎng),網(wǎng)絡通信效率比上一代提升 60%,讓大模型訓練效率提升 20%。

      國產(chǎn)AI芯片公司,得到利好

      顯然,在運營商以及科技巨頭紛紛入場布局之際,國產(chǎn) AI 芯片公司也迎來利好。

      華為昇騰

      據(jù)悉,以政府為主導的城市智能計算中心多采用國產(chǎn)A1芯片中的佼佼者如華為昇騰等,其中華為更是在統(tǒng)計的20多個城市為主體的智能計算中心中占據(jù)79%的市場份額,處于國產(chǎn)AI芯片的*位置。在可預見的2025年,昇騰芯片及服務器的市場依舊會處于緊張的供給局面。

      寒武紀

      2023年寒武紀思元(MLU)系列云端智能加速卡在中國移動正式上線。截至2023年12月,中國移動已有12個省公司、超過70個AI業(yè)務完成向寒武紀思元系列云端智能加速卡的遷移。

      2024年8月,中國移動云能力中心參建的全球運營商*單集群智算中心——中國移動智算中心(哈爾濱)正式投產(chǎn)使用。該智算中心部署超1.8萬張AI加速卡,AI芯片國產(chǎn)化率達100%,可提供6.9EFLOPS(每秒690億億次浮點運算)智能算力。據(jù)悉,該智算中心就是由寒武紀參與建設(shè)。

      南京智能計算中心由南京市麒麟科技創(chuàng)新園與浪潮、寒武紀共同打造,采用浪潮AI服務器算力機組,搭載*的寒武紀思元270和思元290智能芯片及加速卡,已運營系統(tǒng)的AI計算能力達每秒80億億次 (800P OpS)。

      大模型爆火的當下,AI的訓練和推理芯片及訓推一體化等芯片成為市場“香餑餑”,寒武紀在此領(lǐng)域的深耕研發(fā),加速思元系列芯片的迭代。

      摩爾線程2023 年 12 月摩爾線程 KUAE 智算中心揭幕,這是國內(nèi)*以國產(chǎn)全功能 GPU 為底座的大規(guī)模算力集群,以全功能 GPU 為底座,提供軟硬一體化的全棧解決方案。

      2024 年 7 月,摩爾線程聯(lián)合中國移動通信集團青海有限公司、中國聯(lián)通青海公司、北京德道信科集團、中國能源建設(shè)股份有限公司總承包公司、桂林華崛大數(shù)據(jù)科技有限公司等,分別就三個萬卡集群項目進行了戰(zhàn)略簽約,多方將聚力共同構(gòu)建好用的國產(chǎn)GPU集群。

      燧原科技

      2021年燧原科技與之江實驗室在之江實驗室南湖新園區(qū)簽約成立“燧原-之江人工智能芯片聯(lián)合研究中心”。

      成渝智算中心由四川并濟科技投建,燧原科技提供搭建算力底座。

      與此同時,燧原科技還助力太湖億芯(無錫)智算中心、甘肅慶陽算力樞紐的建設(shè)。

      天數(shù)智芯

      中國移動智算中心(呼和浩特)是全球運營商領(lǐng)域內(nèi)規(guī)模*的單體液冷智算中心,智算規(guī)模高達 6.7EFLOPS(FP16),擁有國家級 N 節(jié)點萬卡規(guī)模 AI 訓練場。

      天數(shù)智芯在該項目中充分發(fā)揮天垓 150 產(chǎn)品的*性能與廣泛適用性,與新華三信息技術(shù)強強聯(lián)合,共同打造高性能 AI 訓練服務器。

      壁仞科技

      壁仞科技也參與中國移動呼和浩特智算中心項目。

      此外,壁仞科技的壁礪系列通用 GPU 算力產(chǎn)品還在中國電信落地千卡集群并開展商業(yè)化應用,另外在中國電信集團新一輪國產(chǎn)化 GPU 集采項目中,壁仞科技的主流 GPU 產(chǎn)品已經(jīng)納入中國電信的集采名錄,成為中國電信的主要 GPU 供應商。

      沐曦科技

      2024 年 11月,由上海聯(lián)通攜手加佳科技、沐曦共同打造的曦源一號 SADA 萬卡集群算力項目*期千卡國產(chǎn)算力集群在上海聯(lián)通臨港機房正式落地。該項目以沐曦 GPU 芯片技術(shù)產(chǎn)品為核心,著力構(gòu)建集算力、算法、數(shù)據(jù)、產(chǎn)業(yè)應用為一體的人工智能產(chǎn)業(yè)新生態(tài)。

      據(jù)悉,沐曦和加佳科技已在上海、湖南、江蘇等多地建成智算中心,并計劃于2025年6月完成10000卡國產(chǎn)高質(zhì)量算力建設(shè)。

      何止“萬卡”,甚至要“百萬卡”

      從早期智算中心艱難起步,一步步發(fā)展到如今 “萬卡” 規(guī)模的算力集群紛紛落地,這無疑是巨大的飛躍。當下,行業(yè)頭部廠商更是將視野進一步拓寬,已然聚焦于更為宏大的 “百萬卡” 目標。

      近日,在AI市場快速增長的背景下,博通市值突破 1 萬億美元,創(chuàng)下歷史新高。

      博通首席執(zhí)行官陳福陽表示,他有信心在 2020 年代后期繼續(xù)加大對人工智能的投資。他指出,三年內(nèi),博通的客戶計劃構(gòu)建配備數(shù)百萬個 AI 芯片的大規(guī)模計算集群,從而推動市場大幅增長。

      博通正與三大客戶合作開發(fā) AI 芯片,計劃到 2027 年在網(wǎng)絡集群中部署 100 萬個芯片。據(jù)CNBC報道,他估計,到 2027 年,其 XPU 和 AI 網(wǎng)絡組件的總市場規(guī)模將達到 600 億至 900 億美元。

      雖然博通尚未正式公布其芯片客戶,但分析師表示,該公司正在與谷歌、Meta 和字節(jié)跳動合作,以加速 AI 系統(tǒng)的訓練和部署。據(jù)《金融時報》報道,該公司已為此開發(fā)了定制處理器。

      “萬卡集群”真的有必要嗎?

      先說結(jié)論,“萬卡集群”的建設(shè)一定是有必要的。

      當前,我國智能算力供不應求的問題較為突出,大模型對算力的需求增速遠超單顆 AI 芯片性能的提升步伐。相關(guān)報告顯示,2023 年,中國智能算力需求達 123.6EFLOPS,而供給僅為 57.9EFLOPS,供需缺口一目了然。利用集群互聯(lián)彌補單卡性能短板,或是現(xiàn)階段緩解 AI 算力荒最值得探索與實踐的有效途徑。

      不過,在推進 “萬卡集群” 建設(shè)進程中,有兩大關(guān)鍵難題亟待解決:其一,怎樣高質(zhì)量完成建設(shè)任務,保證集群在穩(wěn)定性、高效性、兼容性等多方面達到標準要求;其二,建成后如何充分挖掘其應用價值,使其在人工智能訓練、大數(shù)據(jù)分析等適配場景發(fā)揮*作用,杜絕資源空置與浪費現(xiàn)象。

      首先,不妨將 “萬卡集群” 類比為參與 “多人多足” 游戲的團隊,大家都清楚,讓一群人如同一個人般整齊劃一地前行并非易事,要調(diào)度上萬張計算卡協(xié)同高效作業(yè)、達成性能的線性擴展、確保任務無間斷運行,這對集群的設(shè)計、調(diào)度以及容錯能力都提出了極高挑戰(zhàn)。

      其次,智算中心的建設(shè)只是一個開端,更重要的是后續(xù)的有效運用。

      據(jù)報道,由于智算中心的投資、建設(shè)、運營通常由不同主體負責,前期建設(shè)方常常對后續(xù)運營模式、服務標準缺乏足夠考量,出現(xiàn) “只管建設(shè)、不顧運營”、建設(shè)與運營脫節(jié)的情況,影響了客戶體驗,致使不少城市所建智算中心的機架利用率不盡人意。

      從商業(yè)模式來講,智算中心大多以出租或售賣算力為主要盈利手段,然而因行業(yè)尚未統(tǒng)一算力定價標準,不同智算中心價格差異懸殊,市場接納程度受限。

      近期,多位智算中心領(lǐng)域從業(yè)者走訪國內(nèi)各地智算中心后,他們中的一些人向《智能涌現(xiàn)》反饋,當前國內(nèi)算力中心市場較為低迷。一位業(yè)內(nèi)人士透露:“就目前所掌握情況,多數(shù)機房出租率大致在 20% - 30% 區(qū)間浮動,部分企業(yè)級智算中心出租率甚至低至 10% 左右。”

      要清楚,智算中心不僅前期需要投入巨額資金購置 GPU 等 AI 芯片,后續(xù)運營階段同樣需要持續(xù)注資。

      《智能涌現(xiàn)》不久前發(fā)文指出,一臺英偉達 *** 服務器(8 卡)租賃價格,已從年初的 12- 18萬元/月,下滑至目前的7.5萬元/月,降幅約50%。

      若按照當前機房20%的利用率來算,一個英偉達***千卡集群智算中心每年營收僅2300 萬元(即7.5 萬元/月×12個月×128臺服務器×20%),這意味著,即便算力中心勉強維持運營,所得收入基本只能覆蓋一半的正常運營成本,前期投入的資本根本無從回本。

      綜上所述,“萬卡集群”已成為智能算力時代的重要里程碑,標志著我國在人工智能領(lǐng)域的算力建設(shè)邁上了新的臺階。從小米、中國移動等科技巨頭正積極布局萬卡集群,以期在這場大模型競賽中占據(jù)有利地位。然而,萬卡集群的建設(shè)并非易事,智算中心需要多長時間才能通過運營收入收回投資,行業(yè)也還需更多的探索。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。