臺(tái)積電前董事長(zhǎng)劉德音加入美光董事會(huì),與英特爾前 CEO 鮑勃・斯旺聚首“深藍(lán)航天”宣布完成新一輪融資,總規(guī)模近 5 億元人民幣精英電腦發(fā)布首款A(yù)M5平臺(tái)入門級(jí)主板B650AM5-MLG Chem 宣布大規(guī)模生產(chǎn)無前驅(qū)體磷酸鐵鋰電池正極材料抖音電商加速分化:店播崛起,達(dá)播退潮“小力出奇跡”的DeepSeek,也難逃大模型安全短板?開啟DLSS 4 步入4K游戲新門檻,耕升 GeForce RTX 5070 踏雪 OC 靈動(dòng)來襲!黑科技小鋼炮!影馳RTX 5070金屬大師OC實(shí)測(cè)RTX 5070正式上市:英偉達(dá)正面應(yīng)對(duì)AMD RX 9070斬獲600美元以下設(shè)備拍照單項(xiàng)第一 TECNO CAMON 40 Pro 5G在DXOMARK影像測(cè)試中獲得138分千億短劇的十字路口:愛優(yōu)騰迎戰(zhàn)字魯大師2月新機(jī)性能/流暢/AI/久用榜:OPPO折疊先發(fā)制人,小米Ultra超大杯登場(chǎng)58同城姚勁波:機(jī)器人很火 但10年內(nèi)替代不了家政阿姨元寶登頂,Kimi失意:AI圈的用戶留存戰(zhàn)三月智慧采購(gòu)季 阿里云SSL證書首購(gòu) 4折起!豆包AI助手推出“深度思考”推理模式AMD RX 9070 XT顯卡性能測(cè)試表現(xiàn)亮眼 能效優(yōu)勢(shì)顯著小米 15 Ultra獲MWC大獎(jiǎng) 國(guó)產(chǎn)高端機(jī)之光!廣和通攜手MediaTek展示5G FWA與MiFi技術(shù)新突破九天微星:千億夢(mèng)想照亮中國(guó)商業(yè)航天新征程
  • 當(dāng)紅炸子雞DeepSeek 為何花心思自研存儲(chǔ)?

    2025年03月05日 17:17:36   來源:產(chǎn)業(yè)家

      存儲(chǔ),這個(gè)一直被談?wù)摰腎T“舊話題”,正在重新站在聚光燈下。

      DeepSeek再次成為破圈話題。

      這兩天,DeepSeek開源3FS并行文件系統(tǒng)的消息,猶如向AI基礎(chǔ)設(shè)施領(lǐng)域投下一枚深水炸彈。3FS每秒能搬運(yùn)6.6TB數(shù)據(jù),相當(dāng)于1秒鐘傳輸完700部4K高清電影。還能自動(dòng)調(diào)資源,國(guó)產(chǎn)芯片用了它,跟國(guó)際大牌的差距直接縮到15%。

      這并非簡(jiǎn)單的技術(shù)迭代——當(dāng)Llama3 70B模型單次訓(xùn)練需吞掉15PB數(shù)據(jù)(相當(dāng)于連續(xù)播放250萬小時(shí)4K視頻)時(shí),全球AI實(shí)驗(yàn)室突然意識(shí)到:決定大模型訓(xùn)練效率的不僅是GPU算力,存儲(chǔ)系統(tǒng)正成為影響AI進(jìn)度的一大瓶頸。

      存儲(chǔ),這個(gè)一直被談?wù)摰腎T“舊話題”,正在重新站在聚光燈下。

      一、當(dāng)AI算力狂飆時(shí)

      存儲(chǔ)正在成為隱形戰(zhàn)場(chǎng)

      2024年,某頭部AI公司曾因存儲(chǔ)帶寬不足,導(dǎo)致2000張A100顯卡的算力利用率長(zhǎng)期低于40%,單日經(jīng)濟(jì)損失超百萬美元。這暴露了AI時(shí)代的"木桶效應(yīng)"——當(dāng)GPU計(jì)算速度進(jìn)入微秒級(jí)時(shí),一次突發(fā)的存儲(chǔ)抖動(dòng)就可能導(dǎo)致整個(gè)訓(xùn)練任務(wù)崩潰,讓數(shù)周的計(jì)算成果瞬間蒸發(fā)。這或許也是DeepSeek自研存儲(chǔ)的原因。

      數(shù)據(jù)顯示,存儲(chǔ)優(yōu)化可直接將175B參數(shù)模型的訓(xùn)練周期壓縮30%,對(duì)應(yīng)百萬美元級(jí)的成本被填平。而在推理端,當(dāng)10%的異常請(qǐng)求遭遇存儲(chǔ)延遲波動(dòng)時(shí),P99響應(yīng)時(shí)間會(huì)瞬間突破SLA紅線,這正是某自動(dòng)駕駛公司在線服務(wù)突發(fā)降級(jí)的根本誘因。

      從DeepSeek的角度來看,其之所以選擇自研3FS的本質(zhì),也正是發(fā)現(xiàn)了存儲(chǔ)架構(gòu)在AI應(yīng)用中的重要性!督鹑谛袠I(yè)先進(jìn)AI存力報(bào)告》》報(bào)告中提到,在同樣的GPU算力規(guī)模下,存儲(chǔ)性能的高低可能造成模型訓(xùn)練周期3倍的差異。在算力軍備競(jìng)賽的背后,一場(chǎng)關(guān)于存儲(chǔ)性能密度的暗戰(zhàn)悄然升級(jí),自研存儲(chǔ)顯得尤為重要。

      二、5家頭部廠商角逐AI存儲(chǔ)

      國(guó)產(chǎn)能否拔得頭籌

      相比于傳統(tǒng)AI的需求,大模型對(duì)存力需求場(chǎng)景具有數(shù)據(jù)量大、參數(shù)規(guī)模大、訓(xùn)練周期長(zhǎng)等特點(diǎn)。

      為了提升大模型訓(xùn)練速度,需要對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行快速加載,且一般采用數(shù)百甚至上萬張GPU構(gòu)成計(jì)算集群進(jìn)行高效的并行計(jì)算,需要高并發(fā)輸入/輸出(I/O)處理,而訓(xùn)練數(shù)據(jù)集呈現(xiàn)海量小文件的特點(diǎn),文件量在幾億到幾十億量級(jí),對(duì)應(yīng)的帶寬需求可能每秒要達(dá)到上TB,這就要求存儲(chǔ)系統(tǒng)具備強(qiáng)大的數(shù)據(jù)管理能力,業(yè)界能達(dá)到該能力的僅寥寥幾家。

      小編搜集了國(guó)內(nèi)外優(yōu)秀的并行存儲(chǔ)產(chǎn)品做了對(duì)比,發(fā)現(xiàn)除了國(guó)外主要做并行文件的幾家公司,國(guó)內(nèi)真正并行文件自主研發(fā)的產(chǎn)品并不多,帶著好奇心我們也看了一下華為存儲(chǔ)、京東云云海,行業(yè)目前有四家優(yōu)秀的并行存儲(chǔ)產(chǎn)品。

      IBM作為老牌存儲(chǔ)品牌,其產(chǎn)品從HPC場(chǎng)景成功向AI場(chǎng)景演進(jìn),但受制于其在國(guó)內(nèi)市場(chǎng)的萎縮,在產(chǎn)品研發(fā)上的投入也有所收縮。在全球AI場(chǎng)景得到廣泛應(yīng)用的DDN,多個(gè)讀、寫帶寬等關(guān)鍵性能指標(biāo)上表現(xiàn)突出,但DDN由于技術(shù)封閉性、專有化硬件等原因,導(dǎo)致用戶建設(shè)成本過高。

      國(guó)產(chǎn)廠商DeepSeek 3FS雖然是開源的新產(chǎn)品,但相對(duì)老牌存儲(chǔ)也有不錯(cuò)的表現(xiàn),在讀帶寬能力上表現(xiàn)優(yōu)異。我們還驚喜發(fā)現(xiàn),另一家國(guó)產(chǎn)廠商京東云云海,在這個(gè)專業(yè)領(lǐng)域表現(xiàn)出色,以單節(jié)點(diǎn)95GB/s的讀帶寬、60GB/s的寫帶寬,進(jìn)一步拉低了國(guó)產(chǎn)存儲(chǔ)與國(guó)際老牌廠商的差距。相較于DeepSeek的3FS,京東云云海在提供高性能的同時(shí)適用性更廣,可以同時(shí)滿足DeepSeek、ChatGPT、LLaMA等20余種主流大模型的存力需求。

      綜上來看,隨著大模型快速向縱深場(chǎng)景演進(jìn),對(duì)存儲(chǔ)的要求也越來越高,DeepSeek、京東云云海等國(guó)產(chǎn)存儲(chǔ),顯示出在處理大規(guī)模數(shù)據(jù)集時(shí)的優(yōu)越性能,未來國(guó)產(chǎn)存儲(chǔ)能否拔得頭籌,我們拭目以待。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。