酷派手機的逆流而上:昔日輝煌與如今的困境傳三星手機國行版將接入DeepSeek 目前已進入測試階段3月2杭州私域展會【私域賽道誰主沉浮?四天一夜,解鎖沸點會的“遙遙領(lǐng)先”密碼!】1月:全球TV面板增長10%,TOP3“再換將”真我Neo7 SE正式發(fā)布,天璣8400游戲神機國補價1530元起三星發(fā)布9100 PRO PCIe 5.0 NVMe SSD,性能提升近一倍AMD Radeon RX 9070 XT 顯卡超頻潛力初現(xiàn)字節(jié)跳動AI助手豆包測試自研深度思考模型阿里千問開源模型衍生數(shù)量突破10萬 穩(wěn)居全球榜首AMD AFMF 2.1 幀生成技術(shù)升級,畫面質(zhì)量顯著提升《使命召喚》確認在 PS5、PS4 系列大作中使用生成式AI平安健康推出AI助手 “平安芯醫(yī)” 提供24小時智能醫(yī)療咨詢服務聯(lián)發(fā)科機海戰(zhàn)術(shù)又一發(fā):天璣6400大核CPU提升100MHz小米15 Ultra“夜神長焦”公布:徠卡2億像素 支持200/400mm無損變焦三星Galaxy Z Fold 7渲染圖首曝光 之后還要搞“可折疊兩次”的新系手機何小鵬:有信心成為中國最早量產(chǎn)L3機器人公司之一蘋果發(fā)布更新測試版本 iPhone 12等機型遇“變磚”BUG《旅行青蛙》宣布終止運營 VIVO服務器將于4月19日關(guān)閉一加首發(fā)天璣9350:千元檔最強性能神機京東零售技術(shù)發(fā)布京點點AIGC內(nèi)容生成平臺 一鍵生成商品圖、營銷文案
  • 首頁 > 云計算頻道 > 大模型

    DeepSeek發(fā)布首個開源MoE模型訓練與推理通信庫DeepEP

    2025年02月25日 14:24:25   來源:DoNews

      在DeepSeek“開源周”活動的第二天,該公司正式發(fā)布了DeepEP,這是首個開源的用于混合專家(MoE)模型訓練和推理的專家并行(EP)通信庫。DeepEP以其高效優(yōu)化的全到全通信方式、支持NVLink和RDMA技術(shù)以及高吞吐量和低延遲的內(nèi)核設計,成為MoE模型開發(fā)的重要工具。

      DeepEP不僅支持低精度計算(包括FP8數(shù)據(jù)格式),還針對不對稱帶寬轉(zhuǎn)發(fā)進行了優(yōu)化,適合訓練和推理的預填充任務。此外,其低延遲內(nèi)核采用純RDMA技術(shù),顯著優(yōu)化了推理解碼速度。通過基于Hook的通信與計算重疊方法,DeepEP進一步提升了GPU資源利用效率。

      當前,DeepEP支持Hopper GPU架構(gòu),并需要Python 3.8、CUDA 12.3、PyTorch 2.1及以上版本,同時依賴NVLink和RDMA網(wǎng)絡進行節(jié)點間通信。該庫的開源為MoE模型的開發(fā)和應用提供了更多可能性。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。