中科聞歌發(fā)布“智川”企業(yè)智能體平臺1.0、“優(yōu)雅”音視頻大模型平臺1.5,領(lǐng)先技術(shù)加速AI普惠落地這個周末,在最懂開發(fā)者的城市邂逅最懂開發(fā)者的算力平臺DDN推出 Infinia 2.0對象存儲 加速AI數(shù)據(jù)處理速度全部免費!百度文心智能體平臺已全面接入DeepSeek模型燈塔云系統(tǒng):開啟勞務(wù)派遣管理4.0時代超2671萬名消費者申請手機等數(shù)碼產(chǎn)品購新補貼 用國補買手機上京東皇家馬德里對陣赫羅納:不乏進球與高水平競技的足球現(xiàn)場OpenAI宣布面向多個國家推出AI代理 Operator扣子Coze宣布獨家支持 DeepSeek Function Calling 工具調(diào)用能力小紅書將接入DeepSeek AI 搜索產(chǎn)品“點點” 內(nèi)測深度思考功能騰訊元寶「混元+DeepSeek」雙模聚合 推出「圖像理解」技能蘋果死磕廉價牌Clone公司推出首款“類人機器人”Protoclone 擁有肌肉和骨骼結(jié)構(gòu)微軟為OpenAI即將推出的 GPT-4.5和 GPT-5模型積極準備服務(wù)器容量國際星閃聯(lián)盟會議在京召開,為星閃2.0標準完成打下基礎(chǔ)Telstra攜手愛立信進行亞太首個5G-A高性能可編程網(wǎng)絡(luò)部署阿里通義萬相宣布即將開源視頻生成模型WanX2.1DeepSeek賦能Vixtel飛思達CloudFox可觀測性平臺,打破可觀測性工程的實施壁壘《和平精英》手游宣布正式接入DeepSeekREDMI K80至尊版曝光:電池超7000mAh 紅米史上最大
  • DeepSeek,做AI競爭的破局者

    2025年02月07日 15:30:06   來源:伯虎財經(jīng)(bohuFN)

      中美大模型的差距在1-2年。起碼在今年春節(jié)之前,這還是一個獲得普遍認同的觀點。

      直到中國科技公司深度求索發(fā)布了推理模型DeepSeek-R1,用不到GPT二十分之一的成本,獲得了和OpenAI的頂尖推理模型o1相當?shù)哪芰Α?/p>

      DeepSeek的影響很快擴散到大洋彼岸。

      1月27日,美國科技股遭遇“黑色風暴”,費城半導體指數(shù)(SOX)狂瀉9.2%,創(chuàng)下2020年3月以來的最大單日跌幅。英偉達股價重挫近17%,市值一夜之間蒸發(fā)近6000億美元,創(chuàng)下美股歷史上最大的單日市值縮水規(guī)模。博通、臺積電、ASML、Google和微軟等科技巨頭也未能幸免,股價分別下跌17.4%、13%、7%、4%和2.14% 。

      與此同時,歐洲科技股市場同樣哀鴻遍野,各類科技股慘遭拋售。

      引發(fā)全球資本市場“強烈地震”的幕后主角——DeepSeek,不是任何發(fā)力大模型的大廠,或者創(chuàng)業(yè)明星,而是一家此前名聲不顯的小型科技初創(chuàng)公司。它由幻方量化創(chuàng)始人梁文鋒一手創(chuàng)辦,成立僅一年多。

      最能喚醒讀者記憶的,可能是去年8月,DeepSeek率先宣布其API價格大幅下調(diào),輸入費用調(diào)整為0.1元/百萬tokens,輸出費用為2元/百萬tokens,隨后各家大廠紛紛跟進。大模型價格戰(zhàn)也就此打響。

      實際上,DeepSeek的創(chuàng)始人梁文鋒或許是最早把目光投向AI的那批人。不僅僅是他創(chuàng)立了量化基金,更有意思的例證是,在算力緊缺的2023年,國內(nèi)只有五家公司擁有萬塊規(guī)模的顯卡,前四位是阿里巴巴、騰訊、百度和字節(jié)跳動,剩下的那個就是幻方量化。

      開源、創(chuàng)新、成本。在硅谷,DeepSeek被稱作“來自東方的神秘力量”。他們一面跟隨,推出類似的推理模型,一面攻擊,要求對其進行封殺甚至算力封鎖。

      1月28日,DeepSeek曾連續(xù)發(fā)布兩條公告稱,DeepSeek線上服務(wù)受到大規(guī)模惡意攻擊。

      客觀來講,從產(chǎn)品實際表現(xiàn)來看,DeepSeek目前只是躋身行業(yè)第一梯隊,尚未實現(xiàn)對市面上現(xiàn)有產(chǎn)品的全面超越,也并非在技術(shù)底層實現(xiàn)了范式創(chuàng)新。

      但DeepSeek確實為全球AI行業(yè)的長期發(fā)展探索出了新的模式,也讓長期被硅谷霸占話語權(quán)的AI行業(yè)出現(xiàn)了一些不一樣的聲音。正如AI領(lǐng)域泰斗吳恩達所言:“DeepSeek的創(chuàng)新表明,中美在生成式AI領(lǐng)域的差距正在迅速縮小,在某些領(lǐng)域中國已現(xiàn)領(lǐng)先跡象。”

      01 DeepSeek,破了誰的金身?

      去年12月,36氪旗下的暗涌賬號采訪了DeepSeek。采訪中提到了去年8月由DeepSeek發(fā)起的價格戰(zhàn),原因指向了一個事實——與很多大廠燒錢補貼不同,DeepSeek是有利潤的。

      早在去年5月,DeepSeek發(fā)布的DeepSeekV2模型,就展現(xiàn)了他們非凡的效率:推理成本被降到每百萬token僅1塊錢,約等于Llama370B的七分之一,GPT-4Turbo的七十分之一。

      并且相較于OpenAI公司來自全球頂尖學府幾千人的大公司人力成本,DeepSeek公司只有寥寥幾百人,也沒有全球前50的人才密度,聚集的是國內(nèi)一眾大學相關(guān)學科的博碩精英人才。

      更加難能可貴的是,DeepSeek-V3在訓練時使用的GPU是英偉達的H800,一款在性能上被閹割的特供AI芯片。相比之下,GPT-4o使用的是上萬塊英偉達***芯片(性能優(yōu)于H800)。

      這和我們過去的認知是不同的。

      英偉達及美股大跌的原因直指DeepSeek,原因在于DeepSeek的成功打破了AI大模型領(lǐng)域“拼投入”的慣常邏輯。AI大模型只有砸錢、砸算力才能做出來的觀念在行業(yè)中深入人心。

      2023年,OpenAI的CEO奧特曼(SamAltman)曾經(jīng)訪問印度,他對印度團隊能否憑借僅 1000 萬美元的預(yù)算,在AI領(lǐng)域構(gòu)建出具有實質(zhì)性成果的模型表示懷疑。

      在他看來,如果沒有上億美元的訓練成本,是煉不出好的大模型的。畢竟作為AI行業(yè)的領(lǐng)軍企業(yè)OpenAI至今都尚未實現(xiàn)盈利,很大一部分原因在于尖端AI模型的訓練耗資驚人,運行成本也十分高昂。據(jù)測算,僅維持ChatGPT的運營,每天成本就高達70萬美元。奧特曼則表示,未來的AI模型成本預(yù)計將超過10億美元。

      高昂的成本也讓后來者紛紛以O(shè)penAI為標桿加大投入。馬斯克旗下的xAI,其超級計算數(shù)據(jù)中心裝配了10萬顆英偉達*** GPU芯片,成為全球最強大的AI訓練集群之一。特朗普上臺后,宣布投資5000億美元啟動“星際之門”項目,試圖憑借巨額資金與強大算力,鞏固美國在AI領(lǐng)域的霸權(quán)地位。

      其他科技巨頭們也在積極布局。過去一年,微軟和谷歌的資本支出均超過 500 億美元,其中大部分資金用于AI相關(guān)的基礎(chǔ)設(shè)施建設(shè),并且計劃在2025財年將這一投入提升至700 - 800億美元。國內(nèi)方面,根據(jù)浙商證券的分析,2024年字節(jié)跳動的資本開支約為800億元,預(yù)計2025年將達到1600億元,其中約900億元將用于AI算力的采購,700億元用于 IDC 基建以及網(wǎng)絡(luò)設(shè)備。

      DeepSeek并非是擁有什么降本魔法,而是摸索出了一條不一樣的道路。DeepSeek的研究員提出了一種新的MLA(一種新的多頭潛在注意力機制)架構(gòu),與 DeepSeek MoESparse (混合專家結(jié)構(gòu))結(jié)合,這種架構(gòu)的優(yōu)勢是顯存占用僅為常用MHA架構(gòu)的5%-13%。

      與此同時,和行業(yè)慣常的用數(shù)萬億token(文本單位)訓練模型不同,而是選擇通過“數(shù)據(jù)蒸餾”,降低了數(shù)據(jù)計算程度,從而實現(xiàn)降本。

      正因為如此,DeepSeek也有了“AI屆的拼多多”之稱,盡管這種表述可能并不完全準確,但也基本表達了DeepSeek對當前主流AI的沖擊。通過這一低成本模式使得DeepSeek能夠更快速地推出新產(chǎn)品和服務(wù),并極大地降低了其市場進入門檻,可以吸引了更多企業(yè)和機構(gòu)參與到AI研發(fā)中來。

      02 開源會是更好的選擇?

      當然,DeepSeek對AI的沖擊還不止于此。

      作為一家中國公司,DeepSeek表現(xiàn)出了前所未有的自信,對產(chǎn)品實施開源策略,也就是公開模型的代碼和架構(gòu)等等,允許公眾查看、使用和修改。這就意味著,很多中小企業(yè)可以直接使用其模型,極大降低了很多企業(yè)的研發(fā)成本。

      相比之下,OpenAI和谷歌等旗下的AI產(chǎn)品都是閉源,DeepSeek的開源和低價策略,對于國際上那些依靠高收費的主流AI工具,也將帶來巨大沖擊。

      DeepSeek并不是個例,在開源浪潮席卷全球的時代,Meta的LLaMA、阿里的通義千問,都在試圖證明“開放才能贏未來”。甚至就連馬斯克也是開源技術(shù)的支持者,此前曾批評OpenAI走向閉源,稱其為“CloseAI”,并指責其違背了最初的開源初衷而奧特曼則是埋頭向前,繼續(xù)閉源。這個爭議還不僅是打口水仗,還曾對薄公庭。

      但盡管如此,依然也有不少業(yè)內(nèi)人士對此嗤之以鼻。

      去年,有行業(yè)人士表示:閉源大模型,才是AI商業(yè)化的最優(yōu)解。

      究其原因,開源模型仍有致命傷:“所謂模型開源,往往只提供了模型的大量參數(shù)。但想要有效應(yīng)用這些模型,還需要進行很多后續(xù)工作。”即便公布參數(shù),開發(fā)者仍難窺見參數(shù)的生成過程和數(shù)據(jù)源等核心“配方”。這種半透明狀態(tài),導致二次開發(fā)如同盲人摸象。

      “由于不了解這些參數(shù)的生成過程和數(shù)據(jù)源,難以直接實現(xiàn)‘眾人拾柴火焰高’的協(xié)同效應(yīng)。即使獲取了模型源代碼,也可能不清楚訓練這些參數(shù)所使用的具體數(shù)量和比例。因此,拿到這些開源資料,并不足以讓人直接站在巨人的肩膀上輕松進行迭代與開發(fā)。

      這也是為什么OpenAI能夠通過閉源在一定時間內(nèi)保持了技術(shù)的領(lǐng)先性和獨特性,構(gòu)建了自己的商業(yè)生態(tài)的原因之一。

      另外,在醫(yī)療、金融等高敏感領(lǐng)域,閉源優(yōu)勢還可以在保護技術(shù)和商業(yè)利益方面有其獨特作用,能保障知識產(chǎn)權(quán)安全,防止技術(shù)濫用。

      但不可否認的是,DeepSeek的確迎來了填補生態(tài)位的絕佳機會。

      在和暗涌的采訪里,梁文鋒就表示,長遠來說,我們希望形成一種生態(tài),就是業(yè)界直接使用我們的技術(shù)和產(chǎn)出,我們只負責基礎(chǔ)模型和前沿的創(chuàng)新,然后其它公司在DeepSeek的基礎(chǔ)上構(gòu)建toB、toC的業(yè)務(wù)。

      用戶無需付費即可享受強大AI推理能力,推動AI技術(shù)普及,讓普通用戶在日常工作生活中體驗前沿科技的便利。在開源生態(tài)上,它已吸引大量開發(fā)者,形成了蓬勃發(fā)展的社區(qū)。隨著越來越多的開發(fā)者和企業(yè)認可開源模式,DeepSeek有望進一步擴大其影響力,重塑AI產(chǎn)業(yè)格局。

      03 一場DeepSeek風暴,揭開中美AI敘事重心的搖擺

      實際上,在全球矚目的目光聚焦于DeepSeek出圈的背后,從技術(shù)領(lǐng)域、產(chǎn)業(yè)范疇到資本市場,DeepSeek都以非凡之勢打破了人們對AI發(fā)展的固有認知,掀起了一場前所未有的技術(shù)變革浪潮,在某種程度上預(yù)示著算力軍備競賽的終結(jié)。

      長期以來,AI行業(yè)形成了一種依賴大規(guī)模算力與巨額資金投入的研發(fā)模式。以O(shè)penAI等公司為例,它們在模型訓練上動輒投入數(shù)億美元,大規(guī)模采購英偉達最頂尖的GPU芯片,致力于構(gòu)建龐大的數(shù)據(jù)中心。英偉達憑借早期賣顯卡的業(yè)務(wù)基礎(chǔ),順勢踏上AI算力的發(fā)展大潮,締造了算力芯片領(lǐng)域的商業(yè)神話。一時間,谷歌、OpenAI、蘋果等各路科技巨頭紛紛排隊向英偉達輸送資金,使其在AI算力市場占據(jù)了主導地位。

      然而,DeepSeek卻以顛覆性的創(chuàng)新打破了這一格局。它僅使用2000塊芯片,投入不到600萬美元,就實現(xiàn)了與行業(yè)巨頭相媲美的性能。這一成果引發(fā)了行業(yè)的深刻反思:“如果DeepSeek的創(chuàng)新是真實有效的,那AI公司真的還需要如此大量的顯卡嗎?”當英偉達還在為每秒200TB的顯存帶寬而自鳴得意時,DeepSeek用一行開源代碼有力地證明了:真正的人工智能不應(yīng)被算力所束縛。

      根據(jù)全球半導體觀察的不完全統(tǒng)計,目前已有包括英偉達、AMD、微軟、亞馬遜云科技、英特爾等國外巨頭,沐曦、天數(shù)智芯、摩爾線程、海光信息等國內(nèi)GPU企業(yè),華為云、騰訊云、天翼云、阿里云、百度智能云、火山引擎等云計算大廠,以及無問芯穹、壁仞科技、硅基流動、PPIO派歐云、云軸科技等共計20家企業(yè)宣布適配及上架DeepSeek模型服務(wù)。隨著多家國內(nèi)外知名云平臺和科技企業(yè)相繼上線DeepSeek大模型,AI市場迎來了新一輪的變革浪潮。

      從另一方面看,英偉達股價的大幅下跌恰恰而言折射出的是在經(jīng)受DeepSeek風暴沖擊下其AI芯片霸權(quán)的逐漸被終結(jié)。正如塔勒布現(xiàn)任對沖基金Universa Investments的顧問的警告,當英偉達把一切都建立在人們會使用你的芯片的希望之上,希望需求持續(xù)增加,同時假設(shè)不會出現(xiàn)軟件上的革命性改進或其他創(chuàng)新方法。而現(xiàn)在,這些假設(shè)受到挑戰(zhàn),未來或?qū)⒊霈F(xiàn)數(shù)倍于當前跌幅的回調(diào)。

      值得關(guān)注的是,DeepSeek帶來的這種技術(shù)路徑的轉(zhuǎn)變,不僅是對美國科技霸權(quán)的有力回擊,也讓全球開發(fā)者重新認識到中國AI的巨大潛力。在美國不斷通過各種限令限制中國AI和芯片發(fā)展的背景下,這場由中國團隊發(fā)起的“效率革命”,或許將重現(xiàn)電動車顛覆燃油車的精彩歷程——以更低的成本、更開放的生態(tài),讓AI從“美國巨頭的專屬玩具”轉(zhuǎn)變?yōu)?ldquo;全民普惠的實用工具”。

      正如DeepSeek技術(shù)白皮書扉頁所寫:“我們并非在追趕GPT,而是在證明:通向AGI的道路,絕不止硅谷這一種走法。”從產(chǎn)業(yè)發(fā)展的角度來看,隨著DeepSeek不斷發(fā)展壯大,未來將逐步采用更多國產(chǎn)芯片,有效降低產(chǎn)業(yè)鏈風險。在DeepSeek的引領(lǐng)下,國產(chǎn)芯片有望逐步從中低端邁向高端,最終擺脫對美國芯片的依賴,在全球AI產(chǎn)業(yè)中占據(jù)更為重要的地位。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。