大模型訓(xùn)練及應(yīng)用、超算為代表的新場景下,社會數(shù)據(jù)量飆升,數(shù)據(jù)處理和挖掘越來越復(fù)雜,傳統(tǒng)的存算一體架構(gòu)正面臨挑戰(zhàn)。
ChatGPT引爆全球范圍內(nèi)的大模型熱潮,但動輒千億參數(shù)級的大模型給底層的數(shù)字基礎(chǔ)設(shè)施提出了新的挑戰(zhàn)。以存儲為例,資源利用效率、框架的靈活性、運維的成本和應(yīng)對高并發(fā)高吞吐的能力都亟需更新。
一場存儲架構(gòu)的底層革新正悄然發(fā)生。
分布式存儲正取代傳統(tǒng)陣列式存儲。IDC中國研究經(jīng)理楊昀煦告訴數(shù)智前線,近年來國內(nèi)的軟件定義存儲和超融合所構(gòu)成的分布式存儲市場增速遠超傳統(tǒng)陣列存儲市場,預(yù)計到2027年將在整個存儲市場里將分走半壁江山。
主流存儲廠商和新興腰部品牌都已開始行動,針對不同的應(yīng)用場景,廠商們正努力延伸自己的業(yè)務(wù)優(yōu)勢和產(chǎn)品優(yōu)勢來滿足客戶需求。經(jīng)過十余年自研存儲產(chǎn)品歷程,依托京東集團內(nèi)部豐富的存儲應(yīng)用場景以及京東重大消費節(jié)點等高流量、高并發(fā)場景的實戰(zhàn)檢驗,京東云也邁出了技術(shù)、產(chǎn)品、方案和經(jīng)驗對外輸出的一步。
去年,基于新一代存儲架構(gòu)的分布式存儲產(chǎn)品云海正式發(fā)布。京東云IaaS產(chǎn)品研發(fā)部負責(zé)人龔義成稱,存算分離釋放的業(yè)務(wù)靈活性、極致性價比和超高性能以及自主可控背景下的真替真用,是京東云海的重要差異能力。數(shù)智前線獲悉,目前,云海已覆蓋零售、物流、金融、健康、工業(yè)等行業(yè)的不同業(yè)務(wù)應(yīng)用場景,并正成為千行百業(yè)解決底層存儲架構(gòu)穩(wěn)定性、實現(xiàn)高性能及降本增效的一種解法。
01
傳統(tǒng)模式正在遭遇挑戰(zhàn)
龔義成對一位企業(yè)IT負責(zé)人的兩難困境印象深刻。作為京東云IaaS產(chǎn)品研發(fā)部負責(zé)人,他時常要跟不同行業(yè)的客戶交流企業(yè)底層IT基礎(chǔ)架構(gòu)建設(shè),近年來他時常聽到有關(guān)數(shù)據(jù)處理和資源使用效率、運維效率和可用性等多方面的“苦水”。
一位金融行業(yè)的客戶告訴他,在此前存算一體的數(shù)據(jù)架構(gòu)下,他們往往要預(yù)備很大的資源冗余,業(yè)務(wù)需要100TB的資源,他們多半要提前籌備400TB,以應(yīng)對臨時擴容需求。但這些未被充分利用的資源往往也意味著巨大的浪費。即使提前預(yù)留了空間,存算一體的框架下,IT運維時也經(jīng)常遇到運維難點。以數(shù)據(jù)庫為例,存算一體架構(gòu)下,數(shù)據(jù)庫要擴容往往非常麻煩,涉及數(shù)據(jù)在集群間的全量遷移復(fù)制,耗時長且過程復(fù)雜。
這實際上是當(dāng)下數(shù)字化變革進一步深入,全社會數(shù)據(jù)處理量飆升,數(shù)據(jù)處理和挖掘場景變得越來越復(fù)雜背景下,企業(yè)在底層存儲架構(gòu)層面遭遇各類挑戰(zhàn)的縮影。
京東云此前有過一項調(diào)查,他們對互聯(lián)網(wǎng)、金融、運營商、智能汽車、游戲、能源、零售及快消、醫(yī)療醫(yī)藥等9個行業(yè)的100多家企業(yè)政府機構(gòu)的IT管理層調(diào)研發(fā)現(xiàn),企業(yè)現(xiàn)階段存儲基礎(chǔ)設(shè)施的痛點包括存儲成本逐年攀升、數(shù)據(jù)安全事故頻發(fā)、存儲集群管理困難、國產(chǎn)化真替真用難等。有五成以上的IT管理者曾受困于存算分離難、數(shù)據(jù)孤島、應(yīng)用抖動、運維困難等問題。
行業(yè)已經(jīng)關(guān)注到全社會層面的存儲成本攀升。IDC發(fā)布的一份報告顯示,全球數(shù)據(jù)將從2018年的33ZB增至2025年的175ZB。中國的數(shù)據(jù)總量也在全球首屈一指,一項調(diào)查顯示,中國數(shù)據(jù)占全球數(shù)據(jù)比重正在從2018年的23.4%發(fā)展到2025年的27.8%。
社會對數(shù)據(jù)重要性的認知變化、數(shù)據(jù)安全合規(guī)的要求及數(shù)據(jù)使用深度的提升帶來存儲成本的上升。例如在保險行業(yè),為了追溯和查驗,監(jiān)管要求相關(guān)業(yè)務(wù)的數(shù)據(jù)、憑證、資料等要完整妥善保管。政府電子檔案要求保存周期為5年甚至更長,公檢法司數(shù)據(jù)要求保存周期至少30年以上。在當(dāng)下最熱的新能源汽車和智能駕駛場景,數(shù)智前線了解到,一臺L3級別的自動駕駛測試車,平均每天產(chǎn)生60TB的數(shù)據(jù),完整測試產(chǎn)生的數(shù)百PB數(shù)據(jù)需要存儲30年以上。
海量的存儲需求使得大量的政府、行業(yè)企業(yè)用戶都開始關(guān)注存儲資源的利用效率。一位行業(yè)內(nèi)資深人士告訴數(shù)智前線,經(jīng)過疫情三年,許多中小企業(yè)客戶對存儲產(chǎn)品的使用和需求中對價格更為敏感,行業(yè)企業(yè)用戶普遍對更具性價比的存儲架構(gòu)產(chǎn)生濃厚的興趣。
另外,新業(yè)務(wù)場景的出現(xiàn)也對存儲基礎(chǔ)設(shè)施應(yīng)對業(yè)務(wù)變化的支撐能力、靈活性和可運維性也提出了新要求。
相關(guān)人士告訴數(shù)智前線,在一些企業(yè)里,從前許多冷存儲的,沒有被分析和挖掘的文件,現(xiàn)在開始有了分析的需求。例如大量的非結(jié)構(gòu)化數(shù)據(jù)需要結(jié)合AI技術(shù)分析,提升企業(yè)對消費者和客戶的服務(wù)水平。以精準(zhǔn)營銷和風(fēng)險控制場景為例,企業(yè)會對幾個月內(nèi)的海量數(shù)據(jù)進行深度挖掘,形成用戶動態(tài)畫像和風(fēng)險特征,反哺精準(zhǔn)營銷和風(fēng)險控制。
通常情況下,這些數(shù)據(jù)的使用方式聚焦于熱數(shù)據(jù)分析,一旦相關(guān)數(shù)據(jù)分析價值降低,挖掘的任務(wù)頻次下降,數(shù)據(jù)存儲和處理就要采用冷數(shù)據(jù)的方式進行管理。需要實時處理的數(shù)據(jù)需要有更高的存儲性能,相對冷的數(shù)據(jù)追求更低的存儲成本。以這類場景為例,冷熱數(shù)據(jù)切換,本質(zhì)上是在不同成本和性能集群上的不同數(shù)據(jù)類型如何自由流轉(zhuǎn),這考驗存儲基礎(chǔ)設(shè)施的數(shù)據(jù)互聯(lián)和統(tǒng)一運維能力。
數(shù)據(jù)重要性不言而喻,企業(yè)變得愈加重視底層存儲資源的安全可靠性,防范數(shù)據(jù)丟失問題。龔義成碰到的一位客戶提及,存儲本地盤擴容時總有些提心吊膽。比如從1PB擴容到2PB,做法非常原始,要先建出來2PB容量的集群,然后再把1PB的數(shù)據(jù)導(dǎo)過去。過程中一旦出現(xiàn)數(shù)據(jù)丟失,對業(yè)務(wù)可能是毀滅性打擊。
超算、大模型等智能化應(yīng)用涌現(xiàn),行業(yè)內(nèi)也爆發(fā)出了對自主可控的高性能存儲基礎(chǔ)設(shè)施的需求。一位資深人士告訴數(shù)智前線,這個場景下更關(guān)注高吞吐低延遲,對存儲有極致的要求,如何在維持架構(gòu)的靈活性的同時也保持高性能,受到相關(guān)場景客戶的關(guān)注。
由此,新的場景、新的需求正在呼喚更具擴展性、更高性能以及更低成本、更具可用性的自主可控新型存儲底層架構(gòu)。
02
分布式存儲加速在行業(yè)應(yīng)用
隨著數(shù)據(jù)量增長及新型分析需求爆發(fā),存儲架構(gòu)正從傳統(tǒng)的集中式存儲向分布式演進。當(dāng)下,存儲市場按照存儲架構(gòu)可以分為傳統(tǒng)企業(yè)級存儲(TESS)、軟件定義存儲(SDS)、超融合基礎(chǔ)架構(gòu)(HCI),軟件定義存儲與超融合就是通常所說的分布式存儲。
不同于存算一體的緊耦合架構(gòu),分布式存儲通常將數(shù)據(jù)管理功能分散在各個存儲節(jié)點,可通過增加節(jié)點數(shù)量實現(xiàn)性能和容量的橫向擴展,利用多節(jié)點冗余保障數(shù)據(jù)可靠性,具備低成本、穩(wěn)定、安全、統(tǒng)一存儲、擴展靈活等諸多優(yōu)勢。
“近年來這一市場增長速度明顯高于傳統(tǒng)的陣列式存儲。”IDC中國研究經(jīng)理楊昀煦告訴數(shù)智前線,以2021年數(shù)據(jù)為例,軟件定義存儲和超融合所構(gòu)成的分布式存儲市場增速接近百分之十幾到20%的增長,而傳統(tǒng)市場增速不到10%,到2027年IDC預(yù)計軟件定義存儲加上超融合產(chǎn)品份額占比達到整個存儲市場的49.5%。
其中,數(shù)據(jù)量的爆發(fā)以及海量非結(jié)構(gòu)化數(shù)據(jù)對于軟件定義存儲市場,尤其是NAS為主的文件存儲和對象存儲增長貢獻明顯。而云應(yīng)用包括對云原生的支持則推動了超融合產(chǎn)品的發(fā)展。
“分布式存儲市場是一個兵家必爭之地,大家都在爭這塊蛋糕。”一位行業(yè)資深人士告訴數(shù)智前線,目前主流頭部和新興廠商們都已投注注意力到這里。例如,華為的存儲產(chǎn)品中軟件定義存儲和超融合的出貨占到45%,而新華三則有差不多56%的出貨是分布式,浪潮的軟件定義存儲加上超融合產(chǎn)品達到了61%左右。同時一些傳統(tǒng)的陣列存儲供應(yīng)商也受到客戶需求的推動,在相關(guān)布局。“當(dāng)下玩家們主要針對不同的應(yīng)用場景延伸自己的業(yè)務(wù)優(yōu)勢和產(chǎn)品優(yōu)勢。”該人士說。
由于各家的積極布局,目前這一架構(gòu)方式正加速在各行各業(yè)落地實踐。
例如,此前普遍認為視頻監(jiān)控等場景會帶來巨大的非結(jié)構(gòu)性數(shù)據(jù),推動分布式存儲需求。當(dāng)下,除了傳統(tǒng)的城市管理領(lǐng)域,在智能交通、智慧城市里汽車追蹤、人像追蹤也在應(yīng)用分布式產(chǎn)品,在能源和制造行業(yè)當(dāng)中,一些腰部廠商們也積極探索在質(zhì)檢等行業(yè)場景應(yīng)用分布式產(chǎn)品來承載大量非結(jié)構(gòu)化數(shù)據(jù)。
業(yè)界觀察到,下沉市場對分布式存儲的需求也在擴大,存儲需求的采購主體逐步向下沉市場和中小企業(yè)市場擴散。
業(yè)界資深人士告訴數(shù)智前線,此前,金融行業(yè)里,對存儲產(chǎn)品的采購主體多是四大行以集采的方式采購傳統(tǒng)存儲陣列,然后分發(fā)到不同的分支機構(gòu)。但現(xiàn)在采購主體在下沉,不同的機構(gòu)業(yè)務(wù)部門基于自身的業(yè)務(wù)特征,開始逐步考慮分布式存儲。比如有個人貸款業(yè)務(wù)的機構(gòu),需要存儲大量的用戶個人數(shù)據(jù)信息,而傳統(tǒng)存儲陣列更多適合進行數(shù)據(jù)溫存儲操作,此時既有計算節(jié)點,又有存儲節(jié)點,有性價比優(yōu)勢的分布式存儲就會進入他們的視線范圍。
在醫(yī)療行業(yè)里,同樣的情況也在發(fā)生,一些省級婦幼保健院、市級的醫(yī)院也在采購分布式存儲產(chǎn)品,去滿足電子病歷等相關(guān)數(shù)據(jù)及PaaS系統(tǒng)數(shù)據(jù)的支撐。
京東云通過調(diào)研則進一步發(fā)現(xiàn),不同行業(yè)的企業(yè)對分布式存儲的利用方式不一。5月9日舉行的京東云城市峰會武漢站上,京東云發(fā)布《云海分布式統(tǒng)一存儲暨京東云存儲白皮書》,白皮書中提及不同行業(yè)客戶在不同的數(shù)據(jù)使用環(huán)境和應(yīng)用場景里,看中的是分布式存儲產(chǎn)品的不同價值點。
例如,互聯(lián)網(wǎng)行業(yè)用戶期望通過分布式存儲打造存算分離的IT架構(gòu),實現(xiàn)資源的靈活擴展和統(tǒng)一調(diào)度,以提升資源利用率,并大幅提升計算和存儲性能,最終實現(xiàn)20%~30%的綜合降本。
在政府、醫(yī)療、智能汽車行業(yè)用戶那里,他們也關(guān)注經(jīng)濟性,期望引入更加經(jīng)濟的分布式存儲系統(tǒng),實現(xiàn)20%+的成本壓縮。而運營商、游戲行業(yè)用戶則期望提升海量數(shù)據(jù)存儲穩(wěn)定性,保障C端應(yīng)用絲滑順暢的消費者體驗和更為安全的數(shù)據(jù)保障。而電力行業(yè)國產(chǎn)化進程加速,自主可控、真替真用成為其當(dāng)下IT建設(shè)重點。
總體來看,更好的資源利用率、更好的容錯性、更靈活的部署方式等都成為千行百業(yè)選擇分布式存儲架構(gòu)的理由。
03
京東云海的解法
在5月9日的峰會演講環(huán)節(jié),龔義成透露一個細節(jié),過去兩三年里,京東已經(jīng)完成從傳統(tǒng)的存算一體架構(gòu)向存算分離的分布式存儲架構(gòu)演變。
2012年,京東正式開啟自研存儲產(chǎn)品的研發(fā)。經(jīng)過十余年的發(fā)展,去年基于京東自身實踐以及從復(fù)雜的場景里提煉與沉淀的能力,京東正式對外發(fā)布了云海分布式統(tǒng)一存儲產(chǎn)品。目前基于云海的存算分離的技術(shù)架構(gòu)已在京東全面落地,相比存算一體的形態(tài),存儲資源利用率提升至85%以上,PaaS綜合成本降低達到30%~50%。
會上,龔義成向現(xiàn)場的伙伴和客戶介紹在分布式存儲領(lǐng)域云海的重點關(guān)注場景和能力,其中存算分離、低成本、高性能和自主可控等關(guān)鍵詞被再三強調(diào)。
數(shù)智前線獲悉,相比存算一體的架構(gòu),PaaS層存算分離的實現(xiàn)面臨著一定的挑戰(zhàn),一方面會涉及多個技術(shù)領(lǐng)域的復(fù)雜性,如分布式計算、分布式存儲、網(wǎng)絡(luò)通信、數(shù)據(jù)庫中間件等PaaS組件。此外,存算分離需要一定的標(biāo)準(zhǔn)化和規(guī)范化,以確保不同系統(tǒng)之間的互操作性和兼容性等。
針對這些問題,龔義成介紹,京東云海通過超低延時RDMA、創(chuàng)新性高容錯分布式一致性協(xié)議、用戶態(tài)NVMe等一系列技術(shù)手段,已經(jīng)將存算分離真正大規(guī)模應(yīng)用到生產(chǎn)環(huán)境中,給業(yè)務(wù)釋放非常大的靈活性。
“數(shù)據(jù)庫中間件的算力可以跟普通的應(yīng)用在一個資源池里面作統(tǒng)一規(guī)劃。計算和存儲解耦獨立,存算資源獨立調(diào)度,不再有固定配比,資源利用率可以立刻提升到85%以上。”龔義成告訴數(shù)智前線。
一個典型的業(yè)務(wù)場景是,2022年春晚紅包場景下,京東云沒有增加采購一臺服務(wù)器就完成了整個春晚活動的技術(shù)支撐,期間應(yīng)對了多次搶紅包、下單的洪峰,就是靠存算分離后的靈活資源調(diào)度來完成的。
它在外部企業(yè)應(yīng)用也非常廣泛,例如在當(dāng)下最熱門的新能源汽車使用場景里,早晚上班高峰期里新能源車企對計算資源的消耗處于高峰值,在傳統(tǒng)存算一體的架構(gòu)下,需要預(yù)先準(zhǔn)備許多計算/存儲資源,并且這些資源無法根據(jù)業(yè)務(wù)的實際峰值做靈活調(diào)度。存算分離后,可以在業(yè)務(wù)峰值時,申請更多的計算資源來滿足業(yè)務(wù)峰值需求,峰值過后,計算資源可以釋放掉,用于滿足其它業(yè)務(wù)。
在全社會關(guān)注降低存儲成本,追求更高性價比產(chǎn)品的背景下,云海所強調(diào)的低成本特性也受到了行業(yè)企業(yè)的關(guān)注。龔義成介紹,京東云通過技術(shù)進步實現(xiàn)了對存儲成本的極致控制。例如傳統(tǒng)的方案下要保證企業(yè)生產(chǎn)活躍度和數(shù)據(jù)安全需要做到3個副本,云海在不降低性能和可靠性的情況下只需要1.14個副本,能夠極大程度降低成本。另外,通過軟件層面的能力,覆蓋不同成本類型的磁盤,以技術(shù)手段規(guī)避低成本磁盤性能差異,實現(xiàn)以更低的成本存儲來滿足企業(yè)的生產(chǎn)活躍度需求。
針對當(dāng)下的大模型應(yīng)用和超算場景,云海也推出了極速版產(chǎn)品。一般而言,在這類高并發(fā)、低時延、對性能要求高的場景中,此前的存儲方案通常由傳統(tǒng)的陣列存儲來覆蓋。分布式存儲產(chǎn)品覆蓋這個市場需要進一步提升技術(shù),打磨性能,從而滿足低時延高并發(fā)要求。云海的解決方案是,基于超低延遲RDMA網(wǎng)絡(luò)、全用戶態(tài)數(shù)據(jù)協(xié)議等技術(shù)手段,實現(xiàn)了性能、擴展性、靈活性的兼顧,實現(xiàn)百萬IOPS、4000MB/s帶寬、百微秒IO延時,滿足各類高性能、大規(guī)模運算場景的存儲需求,大幅提高數(shù)據(jù)分析效率。
數(shù)智前線獲悉,在國內(nèi)某領(lǐng)先的自動駕駛技術(shù)公司的L3與L4模型研發(fā)中,云海的極速版已經(jīng)通過京東云整體提供的AI訓(xùn)練平臺、存儲、計算、網(wǎng)絡(luò)的公有云整體解決方案在企業(yè)落地應(yīng)用,滿足了該企業(yè)上百個GPU計算節(jié)點在模型訓(xùn)練過程中訪問存儲數(shù)據(jù),并應(yīng)對計算節(jié)點的高并發(fā)訪問的需求。
目前,自主可控和安全可靠也是當(dāng)下產(chǎn)業(yè)數(shù)字化進程中的關(guān)鍵詞。龔義成介紹,云海作為自研產(chǎn)品,與飛騰、鯤鵬、海光等國產(chǎn)化硬件完全適配。一方面滿足合規(guī)實現(xiàn)數(shù)據(jù)的高效流通和使用,同時能做到真替真用。
數(shù)字化變革正進入深水區(qū),無論是超高性能場景,還是多樣化的業(yè)務(wù)和數(shù)據(jù)需求,都對未來的存儲提出了新的挑戰(zhàn)。龔義成認為,面對變化的未來,云海的精髓在于,開放靈活的架構(gòu)體系,將帶來極大的靈活性,“就像搭積木,通過不同的小的積木,拼出來不同的存儲的類型,來解決未來用戶不同的存儲場景需求。”
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。