科技媒體 WccfTech 昨日(11 月 13 日)發(fā)布博文,報道稱英偉達首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 訓(xùn)練工作負載中的成績,在訓(xùn)練 Llama 2 70B (Fine-Tuning) 模型時比 Hopper 快 2.2 倍。
測試簡介
英偉達于今年 8 月,首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 推理方面的基準測試成績,而今天首次公布了該 GPU 在 MLPerf v4.1 AI 訓(xùn)練工作負載方面的測試成績。
NVIDIA 表示,隨著新模型的推出,AI 領(lǐng)域?qū)τ嬎愕男枨笳谝灾笖?shù)級增長,因此需要大幅提升訓(xùn)練和推理 AI 的能力,IT之家附上本次訓(xùn)練工作負載主要使用的模型如下:
Llama 2 70B(LLM 微調(diào))
Stable Diffusion(文本到圖像)
DLRMv2(推薦系統(tǒng))
BERT(自然語言處理)
RetinaNet(目標檢測)
GPT-3 175B(LLM 預(yù)訓(xùn)練)
R-GAT(圖神經(jīng)網(wǎng)絡(luò))
這些工作負載的基準測試為評估 AI 加速器的訓(xùn)練性能提供了準確的數(shù)據(jù)支持。
Hopper GPU 的持續(xù)優(yōu)化
Hopper GPU 自發(fā)布以來,經(jīng)過持續(xù)的軟件優(yōu)化,性能得到了顯著提升。*** GPU 在 LLM 預(yù)訓(xùn)練性能上比首次提交時快了 1.3 倍,并且在 GPT-3(175B 訓(xùn)練)中實現(xiàn)了 70% 的性能提升。
英偉達利用 11616 個 *** GPU 進行了 MLPerf 的最大規(guī)模提交,進一步證明了其在數(shù)據(jù)中心級別的強大能力。
Blackwell 的技術(shù)優(yōu)勢
Blackwell GPU 的設(shè)計旨在提高每個 GPU 的計算吞吐量,配備更大更快的高帶寬內(nèi)存,不降低性能的前提下,能夠在更少的 GPU 上運行 GPT-3 175B 基準測試。
根據(jù)測試結(jié)果,64 張 Blackwell GPU 的測試性能,可以達到 256 張 Hopper GPU 的水平。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
11月11日,據(jù)網(wǎng)經(jīng)社數(shù)字零售臺(DR.100EC.CN)數(shù)據(jù)顯示,秋冬服飾仍是雙11的C位,女士針織衫、女士外套、女士羽絨服等位居服飾消費前列,女士夾克銷量同比增長72%,女士棉衣、女士羊毛衫銷量同比增長50%以上。男士外套銷量同比增長30%以上。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。