人工智能應(yīng)用的增長徹底改變了數(shù)據(jù)中心行業(yè),但也面臨著挑戰(zhàn)。最令人擔(dān)憂的問題之一是,人工智能所需的功耗增加和高功率密度環(huán)境,這極大地影響了數(shù)據(jù)設(shè)施的物理基礎(chǔ)設(shè)施需求。
在20世紀(jì)70年代末,數(shù)據(jù)中心功率密度一般在2kW至4kW之間,但現(xiàn)在,為了適應(yīng)AI或高性能計(jì)算(HPC)工作負(fù)載,超過40kW的情況并不罕見。去年11月,Silicon Valley Power透露,其預(yù)測2035年數(shù)據(jù)中心的年度負(fù)載“幾乎是當(dāng)前系統(tǒng)負(fù)載的兩倍”。
JLL Real Estate數(shù)據(jù)中心高級總監(jiān)Colm Shorten表示:“確實(shí),數(shù)據(jù)中心基礎(chǔ)設(shè)施在過去20年里沒有發(fā)生太大變化,因此有些設(shè)計(jì)模型會被重復(fù)使用,無論是基于正常運(yùn)行時間或基于朝九晚五的可用性。“
“最根本的事情始終是確保數(shù)據(jù)中心運(yùn)行、供電、網(wǎng)絡(luò)、冷卻和安全。這些通常會以中高個位數(shù)運(yùn)行,大約8到12kW,19kW被認(rèn)為是高功率。”
“人工智能在顛覆性意義上所做的是,其對這些功率需求提出了挑戰(zhàn),因此機(jī)架密度和機(jī)架功率需求都增加了。如果產(chǎn)生大量電力,就會產(chǎn)生大量熱量。如果產(chǎn)生大量熱量,就必須散發(fā)并消除熱量。”
羅格朗數(shù)據(jù)中心解決方案愛爾蘭和中東歐區(qū)域總監(jiān)David Bradley補(bǔ)充道:“現(xiàn)在我們需要轉(zhuǎn)變思維,考慮如何冷卻這些機(jī)架,以及如何根據(jù)人工智能的需求提供電源架。”
人工智能給數(shù)據(jù)中心行業(yè)帶來的挑戰(zhàn)
隨著計(jì)算能力和芯片設(shè)計(jì)的進(jìn)步,設(shè)備機(jī)架的功率密度每六到七年就會翻一番。根據(jù)Uptime Institute數(shù)據(jù),超過三分之一的數(shù)據(jù)中心運(yùn)營商表示,其密度在過去三年中“迅速增加”。人工智能服務(wù)器集群的密集化,需要從空氣冷卻轉(zhuǎn)向液體冷卻,這帶來了一些挑戰(zhàn),如場地限制、過時風(fēng)險、安裝復(fù)雜性以及可持續(xù)流體選擇有限。專門的冷卻方法,如后門熱交換器,也成為必要的,以解決維持冗余和效率。
人工智能工作負(fù)載的多方面性質(zhì)增加了另一層復(fù)雜性。培訓(xùn)要求減少冗余,但強(qiáng)調(diào)成本效益。Bradley表示:“訓(xùn)練人工智能不依賴于延遲,所以這可能意味著實(shí)際上可以可以在FLAPD中心區(qū)域之外部署新的數(shù)據(jù)中心。"
Shorten補(bǔ)充道:”過去,我們通常會在云區(qū)域或人口密集的地鐵里找一個站點(diǎn),在那里建一個數(shù)據(jù)中心,并為其提供電源,F(xiàn)在可把數(shù)據(jù)中心帶到電源上。與傳統(tǒng)的云模型相比,人工智能培訓(xùn)網(wǎng)站對延遲的敏感度較低。這意味著我們可以獲得傳統(tǒng)上無法獲得的電力。"
人工智能需求激增也加劇了網(wǎng)絡(luò)需求,給數(shù)據(jù)中心帶來了額外的壓力,以確保強(qiáng)大的連接和低延遲。與此同時,對電力冗余和彈性的要求也越來越高。這需要高可靠性機(jī)制和電源之間的無縫切換,以避免整個數(shù)據(jù)中心的停機(jī)風(fēng)險。由非線性元件引起的功率浪涌和諧波畸變等操作風(fēng)險對效率和安全構(gòu)成了持續(xù)的威脅,往往會導(dǎo)致過熱問題。
根據(jù)Shorten先生的說法,數(shù)據(jù)中心對人工智能工作負(fù)載的需求不斷變化,這意味著運(yùn)營商需要考慮面向未來的設(shè)施。其表示:“我們必須開發(fā)一種所謂的混合解決方案,因?yàn)槿绻覀兘⒁粋純粹的傳統(tǒng)模式,那么它就有可能在兩到四年內(nèi)被淘汰。”
"當(dāng)你認(rèn)為建立和發(fā)展數(shù)據(jù)中心的成本在每兆瓦700萬到1000萬美元之間時,如果建立一個100兆瓦的大型數(shù)據(jù)中心,就得投入數(shù)十億美元。然后需要資產(chǎn)持續(xù)15到30年。不可否認(rèn),這中間會有技術(shù)更新,但如果必須在六七年之后改變冷卻技術(shù)或電源分配,尤其是一些人工智能組件幾乎商品化時,那么將面臨挑戰(zhàn)。“
"其中一些機(jī)器和應(yīng)用在物理上很重,所以如果在20年前建造了一個數(shù)據(jù)中心,第一層就要12千萬,而且還得上兩層樓。如果在后門增加熱交換器和其他基礎(chǔ)設(shè)施,這可能會上升到15到20、30千萬。那么,要在兩三年內(nèi)重新設(shè)計(jì)和改造它是非常困難的。”
Bradley補(bǔ)充道:“可以在架子上增加200到300公斤的重量,F(xiàn)在,第一層是無法承受這些。然后會有一個連鎖反應(yīng):必須要做一件事來改造它,然后影響其他的東西。”
"因此,必須研究人工智能的需求--從根本上講,是人工智能的功率和冷卻需求,然后就從那開始設(shè)計(jì)。"
然而,并不是所有人工智能需求激增的挑戰(zhàn)都與物理基礎(chǔ)設(shè)施有關(guān)。監(jiān)管機(jī)構(gòu)很難預(yù)測這項(xiàng)技術(shù)的發(fā)展軌跡,導(dǎo)致了各種各樣的監(jiān)管方法,比如歐盟的《人工智能法案》和NIS2指令。這使得數(shù)據(jù)中心運(yùn)營商很難滿足合規(guī)性要求并相應(yīng)地調(diào)整其基礎(chǔ)設(shè)施。
同樣,數(shù)據(jù)中心要實(shí)現(xiàn)其可持續(xù)性目標(biāo)也變得更加困難。根據(jù)Uptime Institute的《2022年數(shù)據(jù)中心行業(yè)調(diào)查》,63%的數(shù)據(jù)中心運(yùn)營商希望在未來五年內(nèi)強(qiáng)制性的可持續(xù)發(fā)展報(bào)告。《企業(yè)可持續(xù)性報(bào)告指令》(CSRD)將從2024年1月1日起開始對一些歐盟企業(yè)產(chǎn)生影響,并將需要報(bào)告新的指標(biāo),如水和碳使用效率。這對延長基礎(chǔ)設(shè)施、回收冷卻劑、與可持續(xù)供應(yīng)商合作以及使用可再生能源,造成了更大的壓力。
隨著數(shù)據(jù)量的增加,安全風(fēng)險也隨之增加,人工智能引入了自動攻擊和漏洞識別等新威脅。但這些并不總是惡意的,因?yàn)楦鶕?jù)Uptime Institute最近的一項(xiàng)研究,自2020年以來,近40%的組織因人為錯誤而遭受了重大中斷。其中,近85%是由于員工沒有遵循程序或所遵循的流程存在缺陷造成的。數(shù)據(jù)中心必須實(shí)施先進(jìn)的加密、生物識別認(rèn)證和網(wǎng)絡(luò)安全解決方案,以應(yīng)對未經(jīng)授權(quán)的訪問并監(jiān)控異常情況。
Shorten表示:“從安全角度看,人工智能是一把雙刃劍。積極的一面是,如果應(yīng)用其來觀察模式的變化是非常好的。所以,如果發(fā)生網(wǎng)絡(luò)攻擊或者有人闖入環(huán)境,從網(wǎng)絡(luò)的角度來看,人工智能可以發(fā)現(xiàn)異常現(xiàn)象。另一方面,人工智能非常非常強(qiáng)大,可以被惡意者用在不好的地方。”
"網(wǎng)絡(luò)犯罪分子和建立安全和保護(hù)體系的人不斷地相互競爭,以發(fā)展其保護(hù)或滲透能力。"
應(yīng)對挑戰(zhàn)的辦法
隨著挑戰(zhàn)的增加,現(xiàn)有的解決辦法也在增加。Bradley表示,需要從電力和冷卻的角度來解決人工智能帶來的需求,羅格朗就有這些解決方案。
USystems的后門冷卻器等創(chuàng)新設(shè)計(jì)優(yōu)化了熱管理,同時解決了與空間限制和可持續(xù)冷卻選擇相關(guān)的挑戰(zhàn)。它們通過從源頭去除主動設(shè)備產(chǎn)生的熱量來確保最佳的熱和能源性能,防止熱排氣進(jìn)入數(shù)據(jù)室。冷卻器允許每個機(jī)柜的負(fù)載去除高達(dá)92千瓦,并獲得了英國最負(fù)盛名的商業(yè)獎——創(chuàng)新獎。
強(qiáng)大的系統(tǒng)冷卻機(jī)架運(yùn)行人工智能應(yīng)用。Minkels的的擴(kuò)展機(jī)柜配有氣流管理配件,旨在密封間隙,管理電纜進(jìn)入,并為有效的氣流控制創(chuàng)造一個密閉的環(huán)境。液體冷卻解決方案,如直接到芯片或浸入式冷卻,也越來越多地用于管理高密度環(huán)境,比傳統(tǒng)的空氣冷卻方法更有效地散熱。
智能機(jī)架配電單元(PDU),如Raritan PX4和Server Technology PRO4X機(jī)架PDU,設(shè)計(jì)用于處理人工智能帶來的高功耗和密度。這些一流的PDU提供業(yè)界公認(rèn)的高密度出口技術(shù)和突破性的智能功能,可滿足復(fù)雜的人工智能需求。模塊化解決方案和可定制的機(jī)柜提供了適應(yīng)未來增長所需的靈活性和可擴(kuò)展性。
帶有監(jiān)測點(diǎn)的軌道總線解決方案,可以識別潛在的能源效率和可靠性改進(jìn),有助于使配電更能響應(yīng)動態(tài)需求。采用超大中性導(dǎo)體和功率表設(shè)計(jì)的總線,還可以降低電力浪涌和諧波失真的運(yùn)行風(fēng)險,如Starline臨界功率監(jiān)測器。Starline的軌道總線也有助于將電氣安裝時間縮短90%,這要?dú)w功于其首創(chuàng)的接入槽,可以在不中斷服務(wù)的情況下靈活改變布局。Infinium acclAIM等高密度光纖解決方案可以滿足AI推理的任何低延遲要求以及其他網(wǎng)絡(luò)需求,確保城域網(wǎng)集線器和數(shù)據(jù)中心之間的快速響應(yīng)時間和高效數(shù)據(jù)傳輸。
智能機(jī)柜鎖定系統(tǒng),如Nexpand的Smart Lock,符合PCI DSS、SOX、HIPAA、GDPR和EN50600的法規(guī)要求。機(jī)柜可以遠(yuǎn)程打開,也可以讓用戶監(jiān)控誰打開了機(jī)柜,并與視頻監(jiān)控解決方案協(xié)同工作。這樣的物理安全性是有幫助的,但運(yùn)營商應(yīng)該考慮配備最新網(wǎng)絡(luò)安全協(xié)議的智能PDU,并為用戶身份驗(yàn)證、密碼管理和一流的數(shù)據(jù)加密方法提供多種選擇。
采用節(jié)能硬件和可再生能源,對于降低數(shù)據(jù)中心的運(yùn)行成本和碳足跡至關(guān)重要。環(huán)境監(jiān)測裝置,如智能傳感器,其可以追蹤整個設(shè)施的溫度、濕度和氣流,實(shí)現(xiàn)精確的冷卻管理,最大限度地減少能源浪費(fèi)。監(jiān)測數(shù)據(jù)有助于預(yù)測潛在的設(shè)備故障,減少意外停機(jī)的可能性,并告知有關(guān)基礎(chǔ)設(shè)施升級、布局改變或設(shè)備更換的決策,從而減少能源使用。
Shorten表示:“在動力方面,由于Starline總線以及后門熱交換器,羅格朗擁有非常創(chuàng)新的解決方案,正在幫助我們實(shí)現(xiàn)這一目標(biāo)。”
憑借可定制的模塊化設(shè)計(jì),羅格朗提供可擴(kuò)展的解決方案,以滿足不斷變化的需求。其方法確保了面向未來的數(shù)據(jù)中心的可靠性、安全性和能源效率。羅格朗的專家團(tuán)隊(duì)協(xié)助解決復(fù)雜的問題,優(yōu)化從設(shè)計(jì)到管理的每個階段。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。