DeepSeek發(fā)布V2模型 GPT-4的性能白菜的價(jià)格

2024年05月07日 16:44:05 來源：站長(zhǎng)之家

　　DeepSeek在開源MoE(Mixture of Experts)模型領(lǐng)域取得了重要進(jìn)展，繼今年1月份開源國(guó)內(nèi)首個(gè)MoE模型后，現(xiàn)在發(fā)布了第二代MoE模型:DeepSeek-V2。這一新模型在多項(xiàng)性能評(píng)測(cè)中均展現(xiàn)出色的表現(xiàn)，與GPT-4等閉源模型競(jìng)爭(zhēng)，同時(shí)在成本效益上具有顯著優(yōu)勢(shì)。

　　DeepSeek-V2在主流模型評(píng)測(cè)榜單中表現(xiàn)卓越，尤其在中文綜合能力(AlignBench)和英文綜合能力(MT-Bench)上，與頂尖閉源模型并駕齊驅(qū)。此外，在知識(shí)、數(shù)學(xué)、推理、編程等專業(yè)榜單上，DeepSeek-V2也取得了領(lǐng)先位置。

　　DeepSeek-V2采用了創(chuàng)新的模型結(jié)構(gòu)，提出了MLA(Multi-head Latent Attention)架構(gòu)，該架構(gòu)在減少計(jì)算量和推理顯存方面有顯著優(yōu)勢(shì)。結(jié)合自研的Sparse結(jié)構(gòu)DeepSeekMoE，模型在保持性能的同時(shí)，將計(jì)算量降至最低。

　　DeepSeek-V2以較低的顯存消耗實(shí)現(xiàn)了高性能，其每token成本大幅降低，使得實(shí)際部署在8卡H800機(jī)器上的輸入吞吐量超過每秒10萬tokens，輸出超過每秒5萬tokens。API定價(jià)為每百萬tokens輸入1元、輸出2元，價(jià)格極具競(jìng)爭(zhēng)力。

　　DeepSeek秉持開源精神，將DeepSeek-V2模型和相關(guān)論文完全開源，免費(fèi)商用，無需申請(qǐng)。模型權(quán)重可在Hugging Face平臺(tái)獲取，技術(shù)報(bào)告則發(fā)布在GitHub上。

　　DeepSeek提供了對(duì)話官網(wǎng)和開放平臺(tái)，用戶可以在chat.deepseek.com免費(fèi)開啟對(duì)話，而DeepSeek API開放平臺(tái)則提供注冊(cè)即贈(zèng)送大量tokens的優(yōu)惠，以支持優(yōu)質(zhì)項(xiàng)目的發(fā)展。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信