上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機器也能說人話了?阿里國際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領(lǐng)先的目標(biāo)網(wǎng)絡(luò)AI 3D生成天花板再拉升!清華團隊煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團喜歡“追風(fēng)口”快手電商新增近800個“0元開店”類目,推出多項新商入駐權(quán)益年內(nèi)狂攬五項第一,“字節(jié)系大模型”何以后發(fā)先至?
  • 首頁 > 數(shù)據(jù)存儲頻道 > 數(shù)據(jù).存儲頻道 > 數(shù)據(jù)中心

    GPU迫使CIO重新思考數(shù)據(jù)中心

    2024年04月25日 11:19:43   來源:千家網(wǎng)

      生成式人工智能不僅改變了組織開展業(yè)務(wù)的方式,還改變了它們消耗計算資源的方式。這些大型語言模型(LLM)以及數(shù)字孿生、擴展現(xiàn)實和元宇宙等其他人工智能工具,需要大量圖形處理單元(GPU)來訓(xùn)練數(shù)據(jù)集或處理圖形密集型任務(wù)。

      然而,這其中也有一個問題。GPU價格昂貴、供應(yīng)不足,而且消耗大量能源。因此,首席信息官(CIO)和其他業(yè)務(wù)和IT領(lǐng)導(dǎo)者,越來越面臨著如何使用它們以及在何處使用它們的問題。了解所需任務(wù)并平衡處理能力需求和成本至關(guān)重要。

      所有這些都直接與數(shù)據(jù)中心相關(guān)。隨著人工智能成為主流,組織必須適應(yīng),僅僅了解GPU在哪里帶來戰(zhàn)略收益是不夠的,CIO必須做出關(guān)鍵決策,決定何時使用GPU或CPU,以及是否在本地或云端處理訓(xùn)練、推理和其他任務(wù)。

      峰值性能

      盡管最近GenAI備受關(guān)注,但GPU進入數(shù)據(jù)中心已有十多年了。圖形處理器在科學(xué)研究、深度學(xué)習(xí)、機器學(xué)習(xí)以及機器視覺、機器人技術(shù)和自動化等眾多其他任務(wù)中發(fā)揮著關(guān)鍵作用。它們已成為處理復(fù)雜模擬和海量數(shù)據(jù)挑戰(zhàn)的寶貴工具。

      然而,2022年11月,情況發(fā)生了巨大變化。在ChatGPT公開發(fā)布以及隨后出現(xiàn)的MicrosoftCopilot和GoogleGemini等GenAI框架之后,組織開始積極探索將LLM投入使用的方法。很快人們就發(fā)現(xiàn),AI定制對于實現(xiàn)特定任務(wù)至關(guān)重要,包括聊天機器人、內(nèi)容創(chuàng)建、設(shè)計迭代、市場研究、網(wǎng)絡(luò)安全、欺詐檢測、產(chǎn)品原型設(shè)計以及各種其他用例。

      如今,數(shù)據(jù)中心對GPU的需求正在飆升。預(yù)計到2027年,數(shù)據(jù)中心的平均機架密度將達到每機架50kW,超過目前的平均36kW。人工智能和機器學(xué)習(xí)的迅猛發(fā)展正在推動數(shù)據(jù)中心設(shè)計、選址和投資策略的變革浪潮。

      與此同時,GPU的價格越來越高。例如,NVIDIAGeForceRTX4090是一款廣泛部署的頂級型號,于2022年推出,起價約為每臺1,600美元。價格較低、顯存較少的GPU仍需數(shù)百美元。但硬件的前期投資只是一個起點。GPU的耗電量通常是CPU的兩倍或三倍,同時需要強大的冷卻和更復(fù)雜的布線。

      許多數(shù)據(jù)中心都沒有足夠的空間和電力來運行GPU。因此,首席信息官必須就如何處理人工智能做出一些艱難的決定以及GPU何時能帶來明顯的優(yōu)勢。對于一些大規(guī)模并行任務(wù)(如人工智能訓(xùn)練工作負載),GPU實際上可以通過更快地執(zhí)行計算來降低總體TCO。然而,對于其他工作負載(如人工智能推理),CPU通?梢蕴峁┳銐虻男阅,同時降低每瓦運營成本。

      首先要確定具體用例以及所需的性能和準(zhǔn)確度水平。此時,可以考慮成本和碳排放等因素,并確定使用哪種硬件以及處理應(yīng)在云端還是在本地進行。基礎(chǔ)模型訓(xùn)練需要GPU,但推理則不同。在某些情況下,甚至可以在筆記本電腦或手持設(shè)備上進行推理。

      數(shù)據(jù)中心的發(fā)展

      所有主要的云提供商如今都提供預(yù)裝GPU的虛擬機,或租用支持GPU的服務(wù)器的選項。因此,無需投資物理硬件。這些云也不會忽視可管理性。它們提供GPU直通工具,可直接管理GPU硬件上的性能因素。

      這使得CIO能夠配置和管理復(fù)雜的環(huán)境,包括涉及GPU和CPU的混合情況。它包括用于擴展和利用資源、配置GPU內(nèi)存以及為機器學(xué)習(xí)或視頻編輯等特定任務(wù)建立實例類型的工具。

      通過清晰地了解關(guān)鍵因素(包括訓(xùn)練數(shù)據(jù)集的大小和廣度、誰將使用它、系統(tǒng)上的查詢或點擊量預(yù)計是多少、以及GPU和CPU的堆疊方式),可以做出明智的決策。例如,在某些情況下,可能需要不同類型的GPU來推理和運行系統(tǒng),或者帶有加速器的CPU可能更適合處理較小的模型。

      還可以從可持續(xù)性和碳性能權(quán)衡的角度來看待GPU和CPU。我們將看到對AI的需求不斷增長,企業(yè)對GPU的需求也不斷增長。但我們也可能看到GPU和CPU的更多混合,因為許多任務(wù)在成本和碳排放方面仍然更高效。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。