開工首日，國(guó)產(chǎn)芯片萬卡集群和DeepSeek相關(guān)消息來了

2025年02月06日 15:49:50 文|趙艷秋周享玥編|游勇 來源：數(shù)智前線

　　大模型加速走向普惠。

　　2月5日開工第一天，業(yè)界傳來大消息，百度智能云成功點(diǎn)亮自研昆侖芯三代萬卡集群，這也是國(guó)內(nèi)首個(gè)正式點(diǎn)亮的自研萬卡集群。除了解決自身算力供應(yīng)問題之外，有望進(jìn)一步降低大模型成本。

　　此前，DeepSeek推出V3和R1模型，以可媲美OpenAI領(lǐng)先模型的效果和極大的成本降低，在春節(jié)期間引爆全球市場(chǎng)。

　　在陸續(xù)取得突破的背后，AI大模型競(jìng)爭(zhēng)也進(jìn)入新時(shí)期——不再局限于技術(shù)，而是成本、用戶體驗(yàn)、生態(tài)體系的綜合較量。“每天一杯奶茶錢就能養(yǎng)AI”不再是夢(mèng)，AI加速走向普惠化。

　　DeepSeek之后，國(guó)產(chǎn)自研萬卡集群亮相

　　實(shí)際上，在DeepSeek新模型推出后，最近幾天，海內(nèi)外芯片行業(yè)動(dòng)作頻出。海外如英偉達(dá)、AMD、英特爾，國(guó)內(nèi)如華為昇騰、沐曦、天數(shù)智芯、摩爾線程、海光等，紛紛宣布支持DeepSeek模型部署、推理服務(wù)。

　　而在2月5日新春后開工首日，百度智能云也宣布，成功點(diǎn)亮昆侖芯三代萬卡集群，萬卡集群的建成，將進(jìn)一步推動(dòng)模型降本。

　　此前，海外的谷歌、亞馬遜AWS和特斯拉都自研部分芯片，來降低成本，提升性價(jià)比。在中國(guó)，過去一年，算力緊張是大模型成本居高不下的重要因素之一。通過自研芯片和大規(guī)模集群的建設(shè)，不僅解決了自身算力供應(yīng)問題，也有望進(jìn)一步降低大模型成本。

　　昆侖芯是百度自研的AI芯片，初代于2018年推出。

　　最近兩年，昆侖芯對(duì)外鮮有報(bào)道。但在點(diǎn)亮萬卡集群之前，業(yè)界已經(jīng)聽到了一些風(fēng)聲。外界推測(cè)，昆侖三代芯片于2024年量產(chǎn)。也有行業(yè)內(nèi)企業(yè)告訴數(shù)智前線，2024年下半年，他們?cè)u(píng)估購(gòu)買基于昆侖三代芯片的服務(wù)器。

　　百度董事長(zhǎng)李彥宏曾在一些場(chǎng)合強(qiáng)調(diào)，昆侖芯是百度AI技術(shù)棧的“基石”，自研能力保障了在生成式AI時(shí)代的技術(shù)主權(quán)。

　　在2024年的一些對(duì)外介紹中，百度稱昆侖芯，與飛槳深度學(xué)習(xí)框架、文心大模型深度協(xié)同，形成“芯片-框架-模型-應(yīng)用”的端到端優(yōu)化，提升整體性能。

　　數(shù)智前線獲悉，此前兩代昆侖芯片，主要用于AI的部署和推理服務(wù)。昆侖芯三代則更進(jìn)一步，是為大模型和訓(xùn)練優(yōu)化的AI云端芯片。

　　這次點(diǎn)亮的萬卡集群，可將千億參數(shù)模型的訓(xùn)練周期大幅降低，同時(shí)能支持更大模型與復(fù)雜任務(wù)和多模態(tài)數(shù)據(jù)，支撐Sora類應(yīng)用的開發(fā)。此外，萬卡集群能支持多任務(wù)并發(fā)能力，通過動(dòng)態(tài)資源切分，單集群可同時(shí)訓(xùn)練多個(gè)輕量化模型，通過通信優(yōu)化與容錯(cuò)機(jī)制減少算力浪費(fèi)，實(shí)現(xiàn)訓(xùn)練成本指數(shù)級(jí)下降。

　　值得關(guān)注的是，今年推理市場(chǎng)也將是重頭戲。數(shù)智前線獲悉，國(guó)內(nèi)外芯片企業(yè)，都在鉚足勁拼搶英偉達(dá)的市場(chǎng)份額。一位AI算力資深人士告訴數(shù)智前線，推理追求的是“能效比”，比拼每瓦的計(jì)算性能。

　　預(yù)計(jì)百度昆侖芯集群也將加入這一市場(chǎng)的爭(zhēng)奪。而針對(duì)推理市場(chǎng)，業(yè)界的策略是圍繞主流模型，做好適配服務(wù)。毫無疑問，除了自身的文心一言，昆侖芯也適配了DeepSeek等一眾模型。

　　在百度官宣中也提及，隨著國(guó)產(chǎn)大模型的興起，萬卡集群逐漸從“單任務(wù)算力消耗”到“集群效能最大化”過渡，“將訓(xùn)練、微調(diào)、推理任務(wù)混合部署”，從而提升集群綜合利用率，降低單位算力成本。

　　接下來，海內(nèi)外大廠面臨如何突破英偉達(dá)的CUDA護(hù)城河。在過去10多年，英偉達(dá)利用CUDA生態(tài)，既把持訓(xùn)練市場(chǎng)，又圍獵推理市場(chǎng)。CUDA的厲害之處，是面向生命科學(xué)、量化、自動(dòng)駕駛等場(chǎng)景持續(xù)開發(fā)應(yīng)用庫(kù)。“你要完成一個(gè)藥物分子、自動(dòng)駕駛的應(yīng)用，CUDA上可能已寫了10萬行代碼，你可能再寫幾百行，就解決問題了。”上述人士說。

　　目前，不少國(guó)家如英國(guó)、法國(guó)、加拿大和中國(guó)企業(yè)在AI芯片生態(tài)上表現(xiàn)出倔強(qiáng)和韌性，開展基礎(chǔ)生態(tài)建設(shè)。另外，全球一些國(guó)家的高校實(shí)驗(yàn)室和科研機(jī)構(gòu)，在政府的支持下，也持續(xù)在做基礎(chǔ)工作。

　　“每天一杯奶茶錢就能養(yǎng)AI”

　　在最新的芯片進(jìn)展之外，DeepSeek掀起的大模型風(fēng)暴也在繼續(xù)，而各大云計(jì)算大廠已紛紛宣布支持DeepSeek模型調(diào)用或部署，并卷起價(jià)格戰(zhàn)，爭(zhēng)奪市場(chǎng)。

　　大廠的積極性，與DeepSeek模型在全球掀起的巨大流量相關(guān)。這個(gè)春節(jié)假期，“神秘的東方力量”、“AI界拼多多”、“每天一杯奶茶錢就能養(yǎng)的AI”……國(guó)產(chǎn)大模型DeepSeek，不管是在國(guó)內(nèi)，還是國(guó)外，都賺足了關(guān)注度。

　　2月4日，AI產(chǎn)品榜公布，根據(jù)最新統(tǒng)計(jì)數(shù)據(jù)，上線20天，DeepSeek應(yīng)用(不包含網(wǎng)站數(shù)據(jù))日活已破2000萬，上線5天時(shí)日活就已超過ChatGPT上線同期日活，成為全球增速最快的AI應(yīng)用。

　　在微博，2月4日，“DeepSeek回答如何過好這一生”一度登上熱搜第一位。在小紅書，DeepSeek相關(guān)筆記已迅速超49萬，各類教程、測(cè)評(píng)帖密集涌現(xiàn)，甚至有人玩起了“AI算命”。

　　“免費(fèi)使用+更好的效果”是吸引普通用戶嘗鮮的關(guān)鍵。

　　更為關(guān)鍵的是，Deepseek給了OpenAI價(jià)格體系一記重?fù)�。多�?xiàng)數(shù)據(jù)測(cè)算，如果以平均使用情況計(jì)算，DeepSeek-R1 的整體成本，約為OpenAI o1模型的1/30，讓人們可以用極低的成本應(yīng)用AI。

　　隨著 DeepSeek 的爆火，科技大廠之間的大模型價(jià)格戰(zhàn)愈發(fā)激烈。海外的微軟 Azure、亞馬遜AWS和英偉達(dá)NIM服務(wù)，接入DeepSeek模型，試圖通過更具吸引力的性價(jià)比來搶奪市場(chǎng)份額。國(guó)內(nèi)的運(yùn)營(yíng)商、阿里云、百度智能云、火山引擎等也不甘示弱，以各種形式接入DeepSeek模型后，展開了價(jià)格博弈。

　　一些云計(jì)算企業(yè)的價(jià)格與Deepseek官方刊例價(jià)一致，或在此基礎(chǔ)上有一定優(yōu)惠或免費(fèi)額度。

　　其中，2月3日，百度智能云打出的價(jià)格最低，百度智能云R1調(diào)用價(jià)格，是Deepseek官方刊例價(jià)的5折，V3調(diào)用價(jià)格是官方刊例價(jià)的3折，并限時(shí)免費(fèi)兩周。

　　大模型調(diào)用價(jià)格的大幅下降，降低了高質(zhì)量模型的使用門檻，企業(yè)決策阻力驟減，也快速引爆了開發(fā)者的熱情。

　　在全球各個(gè)技術(shù)論壇上，“DeepSeek”是最燃的話題。在開發(fā)者社區(qū)CSDN上，全站綜合熱榜前十名中，有四條都與DeepSeek有關(guān)，相關(guān)應(yīng)用迅速涌現(xiàn)。有網(wǎng)友用DeepSeek將老照片修復(fù)成彩色的，期間沒寫一行代碼。

　　在金融行業(yè)，江蘇銀行將DeepSeek引入到自身服務(wù)平臺(tái)“智慧小蘇”中，并將DeepSeek-VL2多模態(tài)模型、輕量DeepSeek-R1推理模型，分別運(yùn)用到了智能合同質(zhì)檢和自動(dòng)化估值對(duì)賬場(chǎng)景中。

　　某跨國(guó)藥企基于DeepSeek-R1模型構(gòu)建藥物副作用預(yù)測(cè)系統(tǒng)，結(jié)合患者歷史數(shù)據(jù)與實(shí)時(shí)監(jiān)測(cè)，降低臨床試驗(yàn)風(fēng)險(xiǎn)。

　　上海交通大學(xué)已開始用DeepSeek-V3生成合成數(shù)據(jù)，開發(fā)垂類大模型。

　　事實(shí)上，OpenAI為了應(yīng)對(duì)DeepSeek的競(jìng)爭(zhēng)，已迅速推出新模型o3-mini，其定價(jià)也被打下來了。

　　盡管這一價(jià)格仍高于DeepSeek的定價(jià)，但這是一個(gè)顯著的降價(jià)趨勢(shì)。

　　實(shí)際上，DeepSeek這輪大火，也標(biāo)志著AI大模型競(jìng)爭(zhēng)不再局限于技術(shù)，而是成本、用戶體驗(yàn)、生態(tài)體系的綜合較量。

　　“每天一杯奶茶錢就能養(yǎng)AI”不再是夢(mèng)。業(yè)界這一輪動(dòng)作，以極具競(jìng)爭(zhēng)力的價(jià)格優(yōu)勢(shì)，不僅改變了普通用戶對(duì) AI 的使用習(xí)慣，更在行業(yè)內(nèi)掀起了一股變革的浪潮，推動(dòng)著 AI行業(yè)朝著更普惠的方向發(fā)展。

　　大模型普及進(jìn)程將加速

　　一旦各方科技大廠和平臺(tái)力量加入，由DeepSeek引發(fā)的大模型普惠的進(jìn)程將加速。

　　2月3日，我們體驗(yàn)了公有云的DeepSeek API調(diào)用，用Deepseek R1，特別體驗(yàn)了兩個(gè)玩法：

　　玩法一：秦始皇AI軍師體驗(yàn)卡

　　玩法二：老照片時(shí)光染色機(jī)

　　可以看到，即便之前沒有任何技術(shù)背景，登錄百度智能云網(wǎng)站，只需要點(diǎn)擊在線體驗(yàn)，進(jìn)行實(shí)名認(rèn)證，在“模型廣場(chǎng)”就可以輕松調(diào)用DeepSeek-R1和DeepSeek-V3模型。

　　用戶還可在千帆提供的67個(gè)模型中，一次性選擇六個(gè)模型，讓他們同時(shí)干一件事，直觀對(duì)比模型的效果，最終用腳投票。

　　這也是平臺(tái)的優(yōu)勢(shì)所在，集成各種模態(tài)的開閉源模型，就好比AI界的“滴滴打車”，既能比價(jià)比質(zhì)，讓用戶自由選擇最高效價(jià)比模型服務(wù)，也能智能“拼車”、多模態(tài)協(xié)同，互補(bǔ)模型能力，增強(qiáng)應(yīng)用深度。

　　在各種配套服務(wù)上，頭部云平臺(tái)們，在一站式開發(fā)工具鏈、全生命周期安全機(jī)制、行業(yè)解決方案等各項(xiàng)能力的搭建和完善上，也有著極快的反應(yīng)速度。

　　在工具鏈上，盡管大模型爆發(fā)已兩年，但門檻依然較高，需輔以各種好用的工具。比如我們發(fā)現(xiàn)，在Github社區(qū)上，按Star數(shù)排序，其中最受歡迎的DeepSeek項(xiàng)目，一個(gè)是幫助開發(fā)者使用DeepSeek的工具集——DeepSeek-Tools，另一是幫助開發(fā)者自動(dòng)選擇和優(yōu)化DeepSeek模型超參數(shù)的DeepSeek-AutoML。

　　各云大廠也都在工具鏈上進(jìn)行了諸多布局，如百度智能云的千帆大模型平臺(tái)，雖然沒有直接上架DeepSeek工具包，但已集中各種類似工具，如數(shù)據(jù)加工、工作流編排、模型精調(diào)、模型評(píng)估、模型量化......

　　當(dāng)企業(yè)用戶使用DeepSeek模型開發(fā)應(yīng)用，卻擔(dān)心訓(xùn)練數(shù)據(jù)泄露、生成內(nèi)容不符合規(guī)范以及模型在推理過程中被惡意攻擊等問題時(shí)，各云平臺(tái)也都在安全機(jī)制上進(jìn)行了保障。

　　根據(jù)新聞介紹，百度智能云在將DeepSeek接入千帆推理鏈路時(shí)，支持了百度獨(dú)家內(nèi)容安全算子，保障內(nèi)容生成的安全;通過數(shù)據(jù)保險(xiǎn)箱產(chǎn)品，保證模型僅可用于推理預(yù)測(cè)程序，訓(xùn)練數(shù)據(jù)僅可用于模型微調(diào)程序;千帆平臺(tái)集成的BLS日志分析和BCM告警功能，也能保障金融或醫(yī)療等對(duì)安全要求較高的用戶，構(gòu)建的智能化應(yīng)用更安全可靠。

　　而云平臺(tái)們積累的更廣泛的行業(yè)覆蓋和行業(yè)解決方案，也能幫助開發(fā)者實(shí)現(xiàn)在對(duì)應(yīng)行業(yè)和場(chǎng)景的快速?gòu)?fù)制與場(chǎng)景適配，讓DeepSeek快速進(jìn)入這些垂直領(lǐng)域。

　　除了這些，面向企業(yè)逐漸從模型訓(xùn)練、微調(diào)轉(zhuǎn)向推理的大背景，推理的支撐和優(yōu)化成為關(guān)鍵。百度智能云對(duì)DeepSeek進(jìn)行了專項(xiàng)優(yōu)化，如通過針對(duì)DeepSeek模型MLA結(jié)構(gòu)的計(jì)算進(jìn)行了極致的性能優(yōu)化;并通過計(jì)算、通信、訪存不同資源類型算子的有效重疊及高效的Prefill/Decode分離式推理架構(gòu)等，在核心延遲指標(biāo)TTFT/TPOT滿足SLA的條件下，實(shí)現(xiàn)吞吐量“坐火箭”，推理成本“坐滑梯”。

　　千帆支持多種主流推理框架的，讓開發(fā)者可以根據(jù)實(shí)際場(chǎng)景選擇最適合的推理引擎。如，vLLM以高吞吐量和內(nèi)存效率著稱，適合大規(guī)模模型部署;而SGLang特別是在延遲和吞吐量上優(yōu)于其他主流框架。同時(shí)，允許用戶自定義導(dǎo)入和部署模型，為DeepSeek開發(fā)提供了靈活性。

　　通過大廠和平臺(tái)企業(yè)的加入，AI普惠化將成為今年的發(fā)展主線之一。當(dāng)大模型從“土豪玩具”變成“普通人的口糧”，創(chuàng)新門檻的降低將激發(fā)更大的創(chuàng)造力，最終讓人類突破能力和資源的邊界——小店主用AI設(shè)計(jì)爆款包裝、中學(xué)生靠開源模型開發(fā)校園助手、鄉(xiāng)村醫(yī)生借多模態(tài)工具輔助診斷…這場(chǎng)全民參與的智能革命，讓每個(gè)普通人都能站在AI的肩膀上，觸摸曾經(jīng)遙不可及的未來。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信