在DeepSeek“開源周”活動的第二天,該公司正式發(fā)布了DeepEP,這是首個開源的用于混合專家(MoE)模型訓練和推理的專家并行(EP)通信庫。DeepEP以其高效優(yōu)化的全到全通信方式、支持NVLink和RDMA技術(shù)以及高吞吐量和低延遲的內(nèi)核設計,成為MoE模型開發(fā)的重要工具。
DeepEP不僅支持低精度計算(包括FP8數(shù)據(jù)格式),還針對不對稱帶寬轉(zhuǎn)發(fā)進行了優(yōu)化,適合訓練和推理的預填充任務。此外,其低延遲內(nèi)核采用純RDMA技術(shù),顯著優(yōu)化了推理解碼速度。通過基于Hook的通信與計算重疊方法,DeepEP進一步提升了GPU資源利用效率。
當前,DeepEP支持Hopper GPU架構(gòu),并需要Python 3.8、CUDA 12.3、PyTorch 2.1及以上版本,同時依賴NVLink和RDMA網(wǎng)絡進行節(jié)點間通信。該庫的開源為MoE模型的開發(fā)和應用提供了更多可能性。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。