大模型加速走向普惠。
2月5日開工第一天,業(yè)界傳來大消息,百度智能云成功點(diǎn)亮自研昆侖芯三代萬卡集群,這也是國(guó)內(nèi)首個(gè)正式點(diǎn)亮的自研萬卡集群。除了解決自身算力供應(yīng)問題之外,有望進(jìn)一步降低大模型成本。
此前,DeepSeek推出V3和R1模型,以可媲美OpenAI領(lǐng)先模型的效果和極大的成本降低,在春節(jié)期間引爆全球市場(chǎng)。
在陸續(xù)取得突破的背后,AI大模型競(jìng)爭(zhēng)也進(jìn)入新時(shí)期——不再局限于技術(shù),而是成本、用戶體驗(yàn)、生態(tài)體系的綜合較量。“每天一杯奶茶錢就能養(yǎng)AI”不再是夢(mèng),AI加速走向普惠化。
01
DeepSeek之后,國(guó)產(chǎn)自研萬卡集群亮相
實(shí)際上,在DeepSeek新模型推出后,最近幾天,海內(nèi)外芯片行業(yè)動(dòng)作頻出。海外如英偉達(dá)、AMD、英特爾,國(guó)內(nèi)如華為昇騰、沐曦、天數(shù)智芯、摩爾線程、海光等,紛紛宣布支持DeepSeek模型部署、推理服務(wù)。
而在2月5日新春后開工首日,百度智能云也宣布,成功點(diǎn)亮昆侖芯三代萬卡集群,萬卡集群的建成,將進(jìn)一步推動(dòng)模型降本。
此前,海外的谷歌、亞馬遜AWS和特斯拉都自研部分芯片,來降低成本,提升性價(jià)比。在中國(guó),過去一年,算力緊張是大模型成本居高不下的重要因素之一。通過自研芯片和大規(guī)模集群的建設(shè),不僅解決了自身算力供應(yīng)問題,也有望進(jìn)一步降低大模型成本。
昆侖芯是百度自研的AI芯片,初代于2018年推出。
最近兩年,昆侖芯對(duì)外鮮有報(bào)道。但在點(diǎn)亮萬卡集群之前,業(yè)界已經(jīng)聽到了一些風(fēng)聲。外界推測(cè),昆侖三代芯片于2024年量產(chǎn)。也有行業(yè)內(nèi)企業(yè)告訴數(shù)智前線,2024年下半年,他們?cè)u(píng)估購(gòu)買基于昆侖三代芯片的服務(wù)器。
百度董事長(zhǎng)李彥宏曾在一些場(chǎng)合強(qiáng)調(diào),昆侖芯是百度AI技術(shù)棧的“基石”,自研能力保障了在生成式AI時(shí)代的技術(shù)主權(quán)。
在2024年的一些對(duì)外介紹中,百度稱昆侖芯,與飛槳深度學(xué)習(xí)框架、文心大模型深度協(xié)同,形成“芯片-框架-模型-應(yīng)用”的端到端優(yōu)化,提升整體性能。
數(shù)智前線獲悉,此前兩代昆侖芯片,主要用于AI的部署和推理服務(wù)。昆侖芯三代則更進(jìn)一步,是為大模型和訓(xùn)練優(yōu)化的AI云端芯片。
這次點(diǎn)亮的萬卡集群,可將千億參數(shù)模型的訓(xùn)練周期大幅降低,同時(shí)能支持更大模型與復(fù)雜任務(wù)和多模態(tài)數(shù)據(jù),支撐Sora類應(yīng)用的開發(fā)。此外,萬卡集群能支持多任務(wù)并發(fā)能力,通過動(dòng)態(tài)資源切分,單集群可同時(shí)訓(xùn)練多個(gè)輕量化模型,通過通信優(yōu)化與容錯(cuò)機(jī)制減少算力浪費(fèi),實(shí)現(xiàn)訓(xùn)練成本指數(shù)級(jí)下降。
值得關(guān)注的是,今年推理市場(chǎng)也將是重頭戲。數(shù)智前線獲悉,國(guó)內(nèi)外芯片企業(yè),都在鉚足勁拼搶英偉達(dá)的市場(chǎng)份額。一位AI算力資深人士告訴數(shù)智前線,推理追求的是“能效比”,比拼每瓦的計(jì)算性能。
預(yù)計(jì)百度昆侖芯集群也將加入這一市場(chǎng)的爭(zhēng)奪。而針對(duì)推理市場(chǎng),業(yè)界的策略是圍繞主流模型,做好適配服務(wù)。毫無疑問,除了自身的文心一言,昆侖芯也適配了DeepSeek等一眾模型。
在百度官宣中也提及,隨著國(guó)產(chǎn)大模型的興起,萬卡集群逐漸從“單任務(wù)算力消耗”到“集群效能最大化”過渡,“將訓(xùn)練、微調(diào)、推理任務(wù)混合部署”,從而提升集群綜合利用率,降低單位算力成本。
接下來,海內(nèi)外大廠面臨如何突破英偉達(dá)的CUDA護(hù)城河。在過去10多年,英偉達(dá)利用CUDA生態(tài),既把持訓(xùn)練市場(chǎng),又圍獵推理市場(chǎng)。CUDA的厲害之處,是面向生命科學(xué)、量化、自動(dòng)駕駛等場(chǎng)景持續(xù)開發(fā)應(yīng)用庫(kù)。“你要完成一個(gè)藥物分子、自動(dòng)駕駛的應(yīng)用,CUDA上可能已寫了10萬行代碼,你可能再寫幾百行,就解決問題了。”上述人士說。
目前,不少國(guó)家如英國(guó)、法國(guó)、加拿大和中國(guó)企業(yè)在AI芯片生態(tài)上表現(xiàn)出倔強(qiáng)和韌性,開展基礎(chǔ)生態(tài)建設(shè)。另外,全球一些國(guó)家的高校實(shí)驗(yàn)室和科研機(jī)構(gòu),在政府的支持下,也持續(xù)在做基礎(chǔ)工作。
02
“每天一杯奶茶錢就能養(yǎng)AI”
在最新的芯片進(jìn)展之外,DeepSeek掀起的大模型風(fēng)暴也在繼續(xù),而各大云計(jì)算大廠已紛紛宣布支持DeepSeek模型調(diào)用或部署,并卷起價(jià)格戰(zhàn),爭(zhēng)奪市場(chǎng)。
大廠的積極性,與DeepSeek模型在全球掀起的巨大流量相關(guān)。這個(gè)春節(jié)假期,“神秘的東方力量”、“AI界拼多多”、“每天一杯奶茶錢就能養(yǎng)的AI”……國(guó)產(chǎn)大模型DeepSeek,不管是在國(guó)內(nèi),還是國(guó)外,都賺足了關(guān)注度。
2月4日,AI產(chǎn)品榜公布,根據(jù)最新統(tǒng)計(jì)數(shù)據(jù),上線20天,DeepSeek應(yīng)用(不包含網(wǎng)站數(shù)據(jù))日活已破2000萬,上線5天時(shí)日活就已超過ChatGPT上線同期日活,成為全球增速最快的AI應(yīng)用。
在微博,2月4日,“DeepSeek回答如何過好這一生”一度登上熱搜第一位。在小紅書,DeepSeek相關(guān)筆記已迅速超49萬,各類教程、測(cè)評(píng)帖密集涌現(xiàn),甚至有人玩起了“AI算命”。
“免費(fèi)使用+更好的效果”是吸引普通用戶嘗鮮的關(guān)鍵。
更為關(guān)鍵的是,Deepseek給了OpenAI價(jià)格體系一記重?fù)。多?xiàng)數(shù)據(jù)測(cè)算,如果以平均使用情況計(jì)算,DeepSeek-R1 的整體成本,約為OpenAI o1模型的1/30,讓人們可以用極低的成本應(yīng)用AI。
隨著 DeepSeek 的爆火,科技大廠之間的大模型價(jià)格戰(zhàn)愈發(fā)激烈。海外的微軟 Azure、亞馬遜AWS和英偉達(dá)NIM服務(wù),接入DeepSeek模型,試圖通過更具吸引力的性價(jià)比來搶奪市場(chǎng)份額。國(guó)內(nèi)的運(yùn)營(yíng)商、阿里云、百度智能云、火山引擎等也不甘示弱,以各種形式接入DeepSeek模型后,展開了價(jià)格博弈。
一些云計(jì)算企業(yè)的價(jià)格與Deepseek官方刊例價(jià)一致,或在此基礎(chǔ)上有一定優(yōu)惠或免費(fèi)額度。
其中,2月3日,百度智能云打出的價(jià)格最低,百度智能云R1調(diào)用價(jià)格,是Deepseek官方刊例價(jià)的5折,V3調(diào)用價(jià)格是官方刊例價(jià)的3折,并限時(shí)免費(fèi)兩周。
大模型調(diào)用價(jià)格的大幅下降,降低了高質(zhì)量模型的使用門檻,企業(yè)決策阻力驟減,也快速引爆了開發(fā)者的熱情。
在全球各個(gè)技術(shù)論壇上,“DeepSeek”是最燃的話題。在開發(fā)者社區(qū)CSDN上,全站綜合熱榜前十名中,有四條都與DeepSeek有關(guān),相關(guān)應(yīng)用迅速涌現(xiàn)。有網(wǎng)友用DeepSeek將老照片修復(fù)成彩色的,期間沒寫一行代碼。
在金融行業(yè),江蘇銀行將DeepSeek引入到自身服務(wù)平臺(tái)“智慧小蘇”中,并將DeepSeek-VL2多模態(tài)模型、輕量DeepSeek-R1推理模型,分別運(yùn)用到了智能合同質(zhì)檢和自動(dòng)化估值對(duì)賬場(chǎng)景中。
某跨國(guó)藥企基于DeepSeek-R1模型構(gòu)建藥物副作用預(yù)測(cè)系統(tǒng),結(jié)合患者歷史數(shù)據(jù)與實(shí)時(shí)監(jiān)測(cè),降低臨床試驗(yàn)風(fēng)險(xiǎn)。
上海交通大學(xué)已開始用DeepSeek-V3生成合成數(shù)據(jù),開發(fā)垂類大模型。
事實(shí)上,OpenAI為了應(yīng)對(duì)DeepSeek的競(jìng)爭(zhēng),已迅速推出新模型o3-mini,其定價(jià)也被打下來了。
盡管這一價(jià)格仍高于DeepSeek的定價(jià),但這是一個(gè)顯著的降價(jià)趨勢(shì)。
實(shí)際上,DeepSeek這輪大火,也標(biāo)志著AI大模型競(jìng)爭(zhēng)不再局限于技術(shù),而是成本、用戶體驗(yàn)、生態(tài)體系的綜合較量。
“每天一杯奶茶錢就能養(yǎng)AI”不再是夢(mèng)。業(yè)界這一輪動(dòng)作,以極具競(jìng)爭(zhēng)力的價(jià)格優(yōu)勢(shì),不僅改變了普通用戶對(duì) AI 的使用習(xí)慣,更在行業(yè)內(nèi)掀起了一股變革的浪潮,推動(dòng)著 AI行業(yè)朝著更普惠的方向發(fā)展。
03
大模型普及進(jìn)程將加速
一旦各方科技大廠和平臺(tái)力量加入,由DeepSeek引發(fā)的大模型普惠的進(jìn)程將加速。
2月3日,我們體驗(yàn)了公有云的DeepSeek API調(diào)用,用Deepseek R1,特別體驗(yàn)了兩個(gè)玩法:
玩法一:秦始皇AI軍師體驗(yàn)卡
玩法二:老照片時(shí)光染色機(jī)
可以看到,即便之前沒有任何技術(shù)背景,登錄百度智能云網(wǎng)站,只需要點(diǎn)擊在線體驗(yàn),進(jìn)行實(shí)名認(rèn)證,在“模型廣場(chǎng)”就可以輕松調(diào)用DeepSeek-R1和DeepSeek-V3模型。
用戶還可在千帆提供的67個(gè)模型中,一次性選擇六個(gè)模型,讓他們同時(shí)干一件事,直觀對(duì)比模型的效果,最終用腳投票。
這也是平臺(tái)的優(yōu)勢(shì)所在,集成各種模態(tài)的開閉源模型,就好比AI界的“滴滴打車”,既能比價(jià)比質(zhì),讓用戶自由選擇最高效價(jià)比模型服務(wù),也能智能“拼車”、多模態(tài)協(xié)同,互補(bǔ)模型能力,增強(qiáng)應(yīng)用深度。
在各種配套服務(wù)上,頭部云平臺(tái)們,在一站式開發(fā)工具鏈、全生命周期安全機(jī)制、行業(yè)解決方案等各項(xiàng)能力的搭建和完善上,也有著極快的反應(yīng)速度。
在工具鏈上,盡管大模型爆發(fā)已兩年,但門檻依然較高,需輔以各種好用的工具。比如我們發(fā)現(xiàn),在Github社區(qū)上,按Star數(shù)排序,其中最受歡迎的DeepSeek項(xiàng)目,一個(gè)是幫助開發(fā)者使用DeepSeek的工具集——DeepSeek-Tools,另一是幫助開發(fā)者自動(dòng)選擇和優(yōu)化DeepSeek模型超參數(shù)的DeepSeek-AutoML。
各云大廠也都在工具鏈上進(jìn)行了諸多布局,如百度智能云的千帆大模型平臺(tái),雖然沒有直接上架DeepSeek工具包,但已集中各種類似工具,如數(shù)據(jù)加工、工作流編排、模型精調(diào)、模型評(píng)估、模型量化......
當(dāng)企業(yè)用戶使用DeepSeek模型開發(fā)應(yīng)用,卻擔(dān)心訓(xùn)練數(shù)據(jù)泄露、生成內(nèi)容不符合規(guī)范以及模型在推理過程中被惡意攻擊等問題時(shí),各云平臺(tái)也都在安全機(jī)制上進(jìn)行了保障。
根據(jù)新聞介紹,百度智能云在將DeepSeek接入千帆推理鏈路時(shí),支持了百度獨(dú)家內(nèi)容安全算子,保障內(nèi)容生成的安全;通過數(shù)據(jù)保險(xiǎn)箱產(chǎn)品,保證模型僅可用于推理預(yù)測(cè)程序,訓(xùn)練數(shù)據(jù)僅可用于模型微調(diào)程序;千帆平臺(tái)集成的BLS日志分析和BCM告警功能,也能保障金融或醫(yī)療等對(duì)安全要求較高的用戶,構(gòu)建的智能化應(yīng)用更安全可靠。
而云平臺(tái)們積累的更廣泛的行業(yè)覆蓋和行業(yè)解決方案,也能幫助開發(fā)者實(shí)現(xiàn)在對(duì)應(yīng)行業(yè)和場(chǎng)景的快速?gòu)?fù)制與場(chǎng)景適配,讓DeepSeek快速進(jìn)入這些垂直領(lǐng)域。
除了這些,面向企業(yè)逐漸從模型訓(xùn)練、微調(diào)轉(zhuǎn)向推理的大背景,推理的支撐和優(yōu)化成為關(guān)鍵。百度智能云對(duì)DeepSeek進(jìn)行了專項(xiàng)優(yōu)化,如通過針對(duì)DeepSeek模型MLA結(jié)構(gòu)的計(jì)算進(jìn)行了極致的性能優(yōu)化;并通過計(jì)算、通信、訪存不同資源類型算子的有效重疊及高效的Prefill/Decode分離式推理架構(gòu)等,在核心延遲指標(biāo)TTFT/TPOT滿足SLA的條件下,實(shí)現(xiàn)吞吐量“坐火箭”,推理成本“坐滑梯”。
千帆支持多種主流推理框架的,讓開發(fā)者可以根據(jù)實(shí)際場(chǎng)景選擇最適合的推理引擎。如,vLLM以高吞吐量和內(nèi)存效率著稱,適合大規(guī)模模型部署;而SGLang特別是在延遲和吞吐量上優(yōu)于其他主流框架。同時(shí),允許用戶自定義導(dǎo)入和部署模型,為DeepSeek開發(fā)提供了靈活性。
通過大廠和平臺(tái)企業(yè)的加入,AI普惠化將成為今年的發(fā)展主線之一。當(dāng)大模型從“土豪玩具”變成“普通人的口糧”,創(chuàng)新門檻的降低將激發(fā)更大的創(chuàng)造力,最終讓人類突破能力和資源的邊界——小店主用AI設(shè)計(jì)爆款包裝、中學(xué)生靠開源模型開發(fā)校園助手、鄉(xiāng)村醫(yī)生借多模態(tài)工具輔助診斷…這場(chǎng)全民參與的智能革命,讓每個(gè)普通人都能站在AI的肩膀上,觸摸曾經(jīng)遙不可及的未來。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。