DDN推出 Infinia 2.0對(duì)象存儲(chǔ) 加速AI數(shù)據(jù)處理速度全部免費(fèi)!百度文心智能體平臺(tái)已全面接入DeepSeek模型燈塔云系統(tǒng):開啟勞務(wù)派遣管理4.0時(shí)代超2671萬名消費(fèi)者申請(qǐng)手機(jī)等數(shù)碼產(chǎn)品購新補(bǔ)貼 用國補(bǔ)買手機(jī)上京東皇家馬德里對(duì)陣赫羅納:不乏進(jìn)球與高水平競(jìng)技的足球現(xiàn)場(chǎng)OpenAI宣布面向多個(gè)國家推出AI代理 Operator扣子Coze宣布獨(dú)家支持 DeepSeek Function Calling 工具調(diào)用能力小紅書將接入DeepSeek AI 搜索產(chǎn)品“點(diǎn)點(diǎn)” 內(nèi)測(cè)深度思考功能騰訊元寶「混元+DeepSeek」雙模聚合 推出「圖像理解」技能蘋果死磕廉價(jià)牌Clone公司推出首款“類人機(jī)器人”Protoclone 擁有肌肉和骨骼結(jié)構(gòu)微軟為OpenAI即將推出的 GPT-4.5和 GPT-5模型積極準(zhǔn)備服務(wù)器容量國際星閃聯(lián)盟會(huì)議在京召開,為星閃2.0標(biāo)準(zhǔn)完成打下基礎(chǔ)Telstra攜手愛立信進(jìn)行亞太首個(gè)5G-A高性能可編程網(wǎng)絡(luò)部署阿里通義萬相宣布即將開源視頻生成模型WanX2.1DeepSeek賦能Vixtel飛思達(dá)CloudFox可觀測(cè)性平臺(tái),打破可觀測(cè)性工程的實(shí)施壁壘《和平精英》手游宣布正式接入DeepSeekREDMI K80至尊版曝光:電池超7000mAh 紅米史上最大鴻海研究院量子容錯(cuò)計(jì)算技術(shù)取得重大突破DeepSeek“入侵”音樂平臺(tái):搜歌是其次,創(chuàng)作才是正職
  • 首頁 > 產(chǎn)經(jīng)新聞?lì)l道 > 業(yè)界新聞

    低價(jià)接入DeepSeek后,百度再掀算力接力賽

    2025年02月08日 09:36:56   來源:降噪NoNoise

      2025年是AI游戲規(guī)則被改寫的一年。

      在DeepSeek以中式務(wù)實(shí)震驚全球之前,AI大模型競(jìng)賽是一條由資本和GPU所主導(dǎo)的不計(jì)成本之路,參賽者的技術(shù)信仰只有一個(gè)Scaling Law,大力出奇跡。DeepSeek-R1掀起的AI普及浪潮,相當(dāng)于在大路旁邊開辟了一個(gè)分岔,它迫使主要參與者開始反思,讓更多人把AI用起來的前提不僅是技術(shù)領(lǐng)先,還要有足夠低的成本、超預(yù)期的體驗(yàn)。

      最直觀的例子是,ChatGPT-o1雖然與DeepSeek能力相當(dāng),但一個(gè)月200美元的訂閱費(fèi)已經(jīng)將大多數(shù)普通人拒之門外。幡然醒悟的OpenAI,將1月31日上線的推理模型o3-mini設(shè)置為免費(fèi)用戶也可使用。

      目之所及,AI大模型的花式降本將成為2025年的主線之一。抵達(dá)方式有很多,比如高效算力,又或者算法和工程創(chuàng)新。具體到中國,在DeepSeek的激勵(lì)之下,BAT、字節(jié)、華為等國內(nèi)AI大廠已經(jīng)加緊在上述方向你追我趕。

      2月5日,業(yè)內(nèi)再傳新進(jìn)展——首個(gè)國產(chǎn)芯片萬卡集群正式點(diǎn)亮,本土化AI在高效算力上向前一步。

      01

      本土自研萬卡集群正式點(diǎn)亮

      在宣布低價(jià)接入DeepSeek模型兩天后,百度再公布算力降本新進(jìn)展。

      2月5日,百度智能云宣布點(diǎn)亮昆侖芯三代萬卡集群。這也是國內(nèi)首個(gè)正式點(diǎn)亮的自研萬卡集群。

      從全球范圍來看,以合理成本獲得可靠的算力,在當(dāng)前的AI競(jìng)爭(zhēng)中至關(guān)重要。谷歌、Meta、亞馬遜、特斯拉等公司都在加快自研芯片的進(jìn)程,希望以此打破算力瓶頸、降低模型成本。與微軟因?yàn)镚PU供應(yīng)問題而貌合神離的OpenAI,也屢被傳出計(jì)劃自研AI芯片。

      不過,擁有自研芯片只是實(shí)現(xiàn)萬卡集群的第一步。要訓(xùn)練基礎(chǔ)大模型,需要將一萬張以上的加速卡(如GPU、TPU或其他專用AI芯片)組成一個(gè)高性能的「超級(jí)計(jì)算機(jī)」,工程難度極高。

      中國工程院院士、清華大學(xué)計(jì)算機(jī)系教授鄭緯民此前表示,當(dāng)下構(gòu)建國產(chǎn)自主萬卡系統(tǒng)充滿挑戰(zhàn),但「至關(guān)重要」。

      以百度自研萬卡集群為例,它不僅為百度帶來堅(jiān)實(shí)的算力支持,也有望推動(dòng)模型降本趨勢(shì),成為中國科技界在人工智能領(lǐng)域的又一次突破。

      客觀而言,國產(chǎn)芯片早期頂多相當(dāng)于AI大廠基礎(chǔ)設(shè)施的一個(gè)「副本」,更多是作為算力供應(yīng)的一個(gè)補(bǔ)充而存在,主要滿足單任務(wù)算力消耗。而在算力空前緊張、技術(shù)追求自主可控的趨勢(shì)下,國產(chǎn)智算開始承受更多期待,集群效能最大化成為核心目標(biāo)。

      這個(gè)核心目標(biāo)受市場(chǎng)需求驅(qū)動(dòng)。目前國內(nèi)客戶對(duì)大模型的關(guān)鍵訴求至少有兩個(gè):一是縮短訓(xùn)練時(shí)間。百度智能云事業(yè)群總裁沈抖此前提到,由于大模型行業(yè)的發(fā)展日新月異,客戶普遍希望能在兩周內(nèi)完成訓(xùn)練,最晚也應(yīng)在一個(gè)月內(nèi)完成。

      二是降本。從信息時(shí)代到AI時(shí)代,降低技術(shù)成本曲線是科技行業(yè)永恒的主題。按照目前的硅谷規(guī)律,模型訓(xùn)練成本每年大約能降低四分之一,但這遠(yuǎn)不及市場(chǎng)期待。否則DeepSeek也不會(huì)在美國引發(fā)「強(qiáng)震」。據(jù)多方測(cè)算,DeepSeek-R1的整體成本約為OpenAI o1模型的1/30。

      DeepSeek已經(jīng)讓全世界看到中國AI花小錢辦大事的務(wù)實(shí)能力。《華爾街日?qǐng)?bào)》稱之為「夠用就好」策略,英國《金融時(shí)報(bào)》則直言,「并不是每個(gè)司機(jī)都需要一輛法拉利!苟俣赛c(diǎn)亮國產(chǎn)萬卡集群,則屬于中國AI從算力層面尋求成本突破的一個(gè)解法。

      理論上,超大規(guī)模并行計(jì)算能力可實(shí)現(xiàn)訓(xùn)練效率躍升,萬卡集群可將千億參數(shù)模型的訓(xùn)練周期大幅降低,滿足AI原生應(yīng)用快速迭代的需求;同時(shí)也能支持更大模型與復(fù)雜任務(wù)和多模態(tài)數(shù)據(jù),支撐Sora類應(yīng)用的開發(fā)。

      另一方面,萬卡集群能夠支持多任務(wù)并發(fā)能力,通過動(dòng)態(tài)資源切分,單集群可同時(shí)訓(xùn)練多個(gè)輕量化模型,通過通信優(yōu)化與容錯(cuò)機(jī)制,提升集群綜合利用率,實(shí)現(xiàn)訓(xùn)練成本指數(shù)級(jí)下降。

      不過在實(shí)踐中,超大規(guī)模集群的調(diào)度效率至關(guān)重要。比如怎么做模型的拆分,如何將訓(xùn)練、微調(diào)、推理任務(wù)混合部署,都會(huì)影響算力的有效發(fā)揮。

      百度能率先點(diǎn)亮自研萬卡集群,其實(shí)背后離不開百舸AI異構(gòu)計(jì)算平臺(tái)4.0等超前基礎(chǔ)設(shè)施的支撐。

      2024年9月升級(jí)的百舸4.0屬于大模型降本的「全能型選手」。僅降低通信瓶頸一項(xiàng),便將帶寬有效性提升到90%以上。在提供容錯(cuò)與穩(wěn)定性機(jī)制上,通過避免由于單卡故障率隨規(guī)模指數(shù)上升而造成的集群有效性大幅下降,保障有效訓(xùn)練率達(dá)到98%。

      據(jù)了解,在百舸4.0的支撐下,百度自研3萬卡集群也已經(jīng)在路上。

      從行業(yè)發(fā)展角度來看,百度通過自研大規(guī)模集群的建設(shè),不僅解決了自身算力供應(yīng)的問題,也為整個(gè)行業(yè)提供了新的思路和方向。

      02

      AI應(yīng)用爆發(fā)的杰文斯悖論

      中外科技公司狂卷AI成本,行業(yè)影響深遠(yuǎn)。

      如果沒有DeepSeek「上線20天日活2000萬」的現(xiàn)場(chǎng)教學(xué),科技界或許很難將大模型降本帶來的變量具像化。盡管業(yè)界領(lǐng)袖都認(rèn)為這一天早晚會(huì)到來。

      比如微軟CEO納德拉,在DeepSeek爆發(fā)前夕,他還在社交媒體上布道,「隨著人工智能變得更加高效和普及,我們將看到它的使用量猛增,成為一種永遠(yuǎn)無法滿足的商品」,經(jīng)濟(jì)學(xué)中的「杰文斯悖論」會(huì)在AI領(lǐng)域復(fù)現(xiàn)。

      AI芯片初創(chuàng)公司Groq的首席執(zhí)行官此前直言,運(yùn)行AI模型的成本越低,AI能力顯然就越強(qiáng),「如果推理成本太高,人們就不會(huì)太多使用」,而更高的使用率才能催生更好的模型。

      翻譯過來,英偉達(dá)的軟肋,未嘗不是AI開發(fā)者以及整個(gè)AI生態(tài)的幸事。

      在移動(dòng)互聯(lián)網(wǎng)時(shí)代,從應(yīng)用層到基礎(chǔ)設(shè)施的倒三角型利益分配,催生了數(shù)量眾多的超級(jí)應(yīng)用和明星獨(dú)角獸,支撐了移動(dòng)生態(tài)的長久繁榮。而在生成式AI時(shí)代初期,絕大多數(shù)AI投資最終流向了基礎(chǔ)設(shè)施層企業(yè)——強(qiáng)如微軟,其AI基礎(chǔ)設(shè)施投資中約有一半的錢也要用來買卡。

      這一客觀現(xiàn)實(shí)無形中抬高了AI應(yīng)用開發(fā)的門檻。

      DeepSeek的崛起,意味著AI行業(yè)的發(fā)展正從硬件基礎(chǔ)設(shè)施層向軟件應(yīng)用層轉(zhuǎn)移;ㄆ煸谧钚庐a(chǎn)業(yè)研報(bào)中預(yù)測(cè):DeepSeek、百度等中國模型的高效低成本將有助于加速全球AI應(yīng)用開發(fā),可能在全球引發(fā)更多技術(shù)創(chuàng)新,并推動(dòng)2025年人工智能應(yīng)用的拐點(diǎn)。

      舉個(gè)例子,百度自研萬卡集群所代表的低成本算力,可以支撐Sora類多模態(tài)應(yīng)用的開發(fā)。目前海外視頻生成的成本并不算低。Runway生成一條5秒視頻的價(jià)格為1.2美元,Sora生成一個(gè)5秒480P視頻成本約為0.5美元,如果多模態(tài)模型成本繼續(xù)下探,理論上會(huì)有更多的多模態(tài)應(yīng)用出現(xiàn)。

      而DeepSeek-R1的高效推理能力,可能會(huì)直接帶來企業(yè)智能體領(lǐng)域的突破性進(jìn)展。企業(yè)智能體的目標(biāo)是處理工作任務(wù),如果能以更低的推理成本擁有智能體類的AI員工,企業(yè)客戶的盈利能力也將間接得到提升。

      為了加速AI應(yīng)用開發(fā)的繁榮,在DeepSeek出圈以來,百度智能云、華為云、阿里云、騰訊云、火山引擎等也在爭(zhēng)相接入DeepSeek模型,并以優(yōu)惠條件吸引更多的企業(yè)客戶和開發(fā)者。

      這其中,百度在「砍門檻」上算是比較激進(jìn)的一家。2月3日百度智能云直接宣布打折——千帆ModelBuilder平臺(tái)上的DeepSeek-R1僅為官方刊例價(jià)的5折,DeepSeek-V3僅為官方刊例價(jià)的3折,并提供限時(shí)免費(fèi)服務(wù)。

      「砍門檻」的背后,是百度智能云在推理引擎性能優(yōu)化技術(shù)、推理服務(wù)工程架構(gòu)創(chuàng)新以及推理服務(wù)全鏈路安全保障上的深度融合。

      在推理引擎性能上,針對(duì)DeepSeek模型MLA結(jié)構(gòu)的計(jì)算進(jìn)行了極致的性能優(yōu)化,并通過計(jì)算、通信、內(nèi)存不同資源類型算子的有效重疊及高效的Prefill/Decode分離式推理架構(gòu)等,在核心延遲指標(biāo)TTFT/TPOT滿足SLA的條件下,實(shí)現(xiàn)模型吞吐的大幅度提升。

      在推理服務(wù)的工程架構(gòu)上,百度智能云做了嚴(yán)格的推/拉模式的性能對(duì)比。為了進(jìn)一步提升系統(tǒng)的穩(wěn)定性和用戶體驗(yàn),設(shè)計(jì)了請(qǐng)求失敗的續(xù)推機(jī)制,這顯著增強(qiáng)了系統(tǒng)的容錯(cuò)能力和服務(wù)SLA達(dá)標(biāo)率。同時(shí)針對(duì)多輪對(duì)話和system設(shè)定等場(chǎng)景中存在重復(fù)Prompt前綴的情況,實(shí)現(xiàn)了主流的KV-Cache復(fù)用技術(shù),并輔以全局Cache感知的流量調(diào)度策略。

      在穩(wěn)定安全保障上,集成了百度智能云獨(dú)家內(nèi)容安全算子,實(shí)現(xiàn)模型安全增強(qiáng)與企業(yè)級(jí)高可用保障,基于大模型全生命周期數(shù)據(jù)安全與模型保護(hù)機(jī)制,在千帆平臺(tái)上的模型均擁有使用安全的安全保障。

      DeepSeek模型上線首日,已有超1.5萬家客戶通過千帆平臺(tái)進(jìn)行模型調(diào)用。

      「價(jià)格戰(zhàn)」背后,本質(zhì)還是一個(gè)由于AI應(yīng)用所主導(dǎo)的AI生態(tài)之爭(zhēng)。

      在這個(gè)過程中,對(duì)沖基金橋水判斷,AI對(duì)算力的需求不會(huì)放緩,反而可能加速!附芪乃广U摗顾坪跤啦贿^時(shí)。

      這也是為什么微軟、Meta、谷歌、百度、字節(jié)今年都在算力上加大投入。根據(jù)目前的公開信息,微軟計(jì)劃在截至今年6月份的財(cái)年對(duì)AI數(shù)據(jù)中心投資800億美元,Meta今年計(jì)劃在AI基礎(chǔ)設(shè)施等領(lǐng)域投入650億美元。用谷歌CEO皮查伊的話說,大家都想擁抱更多的發(fā)展機(jī)會(huì)。

      在納德拉宣布微軟在 AI 和云基礎(chǔ)設(shè)施方面的800億美元后,馬斯克轉(zhuǎn)發(fā)了這一消息

      縱觀全球AI競(jìng)爭(zhēng),擁有更高性能、更低成本的算力,始終是AI巨頭保證領(lǐng)先地位的重要抓手。

      國內(nèi)頭部企業(yè)如百度,除了已經(jīng)路上的3萬卡集群,百舸4.0設(shè)計(jì)之初可支持10萬卡用量,這一「留白」為中國AI企業(yè)更低門檻的創(chuàng)新突破積蓄了一定的空間。

      憑借其強(qiáng)大的算力優(yōu)勢(shì)、成本效益以及百舸平臺(tái)的全方位賦能,百度等國內(nèi)AI公司有望為人工智能的發(fā)展注入新的活力。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。