5G確定性工業(yè)基站首商用,工業(yè)互聯(lián)網(wǎng)走上新高度李飛飛團(tuán)隊(duì)前瞻性研究 多模態(tài)AI模型初顯空間智能AI終于邁過(guò)這道檻!Livekit 開(kāi)源模型精準(zhǔn)識(shí)別“你是否說(shuō)完”!DeepSeek開(kāi)源大模型開(kāi)發(fā)者之一羅福莉?qū)⒓用诵∶?/a>廣汽詳解旗下首款復(fù)合翼飛行汽車(chē) GOVY AirJet:最高飛行速度可達(dá) 250km/h清華大學(xué)聯(lián)合騰訊出品!ColorFlow:自動(dòng)給黑白漫畫(huà)上色,保持角色一致性Adobe推新AI音頻具Sketch2Sound ,只需哼唱和模仿聲音就能創(chuàng)建音效家庭能源智聯(lián)自由 海辰儲(chǔ)能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o(jì)3:AI 推理能力的重大突破,得分高達(dá)87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團(tuán)外賣(mài)出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動(dòng)6000億GTV后,抖音計(jì)劃偷襲美團(tuán)大本營(yíng)AGI Open Network(AON):賦能每個(gè)人創(chuàng)建、部署和貨幣化AI Agent貸款利率史上最低了嗎?東融教你看懂歷年啥水平“客服來(lái)電”有詐?抖音客服上線“驗(yàn)證助手”助用戶(hù)識(shí)別詐騙OpenAI新模型GPT-5研發(fā)未達(dá)預(yù)期:成本高昂 效果不佳曝天馬打入果鏈:為蘋(píng)果HomePod供應(yīng)LCD屏 每塊屏僅10美元曝OPPO或首發(fā)新款天璣次旗艦芯片 兩大子品牌Q2發(fā)力諾基亞攜手阿聯(lián)酋運(yùn)營(yíng)商e&,展示全球首個(gè)固網(wǎng)游戲端到端網(wǎng)絡(luò)切片方案
  • 首頁(yè) > 數(shù)據(jù)存儲(chǔ)頻道 > 數(shù)據(jù).存儲(chǔ)頻道 > 半導(dǎo)體

    英偉達(dá)的江山,還能坐多久?

    2023年09月05日 14:53:44   來(lái)源:微信公眾號(hào):AI新智能

      國(guó)產(chǎn)芯片的“算力之困”,確實(shí)撕開(kāi)了一道口子。

      當(dāng)下的AI賽場(chǎng)上,英偉達(dá)無(wú)疑是最閃耀的一顆明星。

      十多年來(lái),英偉達(dá)在生產(chǎn)能夠執(zhí)行復(fù)雜AI任務(wù)(如圖像、面部和語(yǔ)音識(shí)別)的芯片方面,建立了幾乎無(wú)法撼動(dòng)的*地位。

      然而,凡事總有變化。

      近期,隨著谷歌、IBM等巨頭開(kāi)始在芯片方面一齊發(fā)力,GPU領(lǐng)域的競(jìng)爭(zhēng)格局,開(kāi)始有了些微妙的改變。

      最近,IBM推出一款全新的14nm模擬AI芯片,效率達(dá)到了最*GPU的14倍。

      其*的亮點(diǎn),就是借助神經(jīng)網(wǎng)絡(luò)在生物大腦中運(yùn)行的關(guān)鍵特征,來(lái)減少能耗。從而*限度地減少人們?cè)谟?jì)算上花費(fèi)的時(shí)間和精力。

      同樣的,身為科技巨頭的谷歌,也在8月底的GoogleCloudNext2023大會(huì)上,發(fā)布了一款全新AI芯片CloudTPUv5e,專(zhuān)為大模型訓(xùn)練推理所設(shè)計(jì)。

      具體來(lái)說(shuō),CloudTPUv5e允許多達(dá)256個(gè)芯片互連,聚合帶寬超過(guò)400Tb/s和100petaOps的INT8性能。

      根據(jù)速度基準(zhǔn)測(cè)試,在CloudTPUv5e上訓(xùn)練和運(yùn)行人工智能模型的速度提高了5倍。

      由此可見(jiàn),各大巨頭其實(shí)并不甘于在算力問(wèn)題上永遠(yuǎn)被英偉達(dá)“卡脖子”,并開(kāi)始紛紛推出了各自的芯片,對(duì)英偉達(dá)的GPU霸權(quán)地位發(fā)起了“圍攻”。

      那么,在英偉達(dá)深不見(jiàn)底的護(hù)城河面前,這樣的挑戰(zhàn)前景究竟如何?

      01 “霸主”的遠(yuǎn)慮

      英偉達(dá)的江山還能坐多久?

      從某種程度上說(shuō),決定這件事的,不僅僅是英偉達(dá)本身的創(chuàng)新能力,還有科技發(fā)展固有的定律。

      作為計(jì)算機(jī)行業(yè)的黃金定律,摩爾定律一直指導(dǎo)著芯片開(kāi)發(fā)。

      但是隨著芯片工藝升級(jí)速度的放緩,圍繞在這一定律身上的爭(zhēng)議也在不斷擴(kuò)大。

      所謂摩爾定律,指的是集成電路上可以容納的晶體管數(shù)目在大約每經(jīng)過(guò)18個(gè)月到24個(gè)月便會(huì)增加一倍。

      然而,隨著芯片技術(shù)的不斷發(fā)展,摩爾定律正逐漸遭遇瓶頸。

      CIC灼識(shí)咨詢(xún)?cè),受制于芯片尺寸的物理極限、光刻技術(shù)、隧道效應(yīng)、功耗和散熱、供電能力等問(wèn)題,從5nm到3nm再到2nm,其間隔都超過(guò)了2年時(shí)間。

      面對(duì)這種情況,即使是以“刀法精湛”著稱(chēng)的黃仁勛,也不得不無(wú)奈地宣布“摩爾定律已死”,漲價(jià)身不由己!

      其在去年發(fā)布的 AD102(RTX4090) 芯片,尺寸為 608mm,這僅比 628mm 的 GA102(RTX3090Ti)略小。

      按照這樣的技術(shù)路徑,傳統(tǒng)GPU的天花板,似乎已經(jīng)越來(lái)越近。

      也正因如此,各路巨頭在解決算力之困的同時(shí),也在積極地“另辟蹊徑”,找到一條有別于傳統(tǒng)路線的破局之策。

      前面提到的IBM模仿人腦神經(jīng)結(jié)構(gòu)的類(lèi)腦芯片,就是這樣的嘗試之一。

      然而,在面對(duì)傳統(tǒng)芯片瓶頸方面,業(yè)界存在著很多種不同的方案,比如量子芯片、光子芯片、類(lèi)腦芯片,但如同當(dāng)年GPU取代CPU,成為今天AI計(jì)算的主力一樣,在多種技術(shù)路徑的博弈中,最終往往會(huì)有一個(gè)“*”的路徑勝出,成為新時(shí)代通用的芯片范式。

      而這樣的“*”路徑,則理應(yīng)是一種在技術(shù)成熟度、通用性和市場(chǎng)需求等方面,都做到了較好兼顧的一種方案。

      就目前的情況來(lái)看,量子芯片、光子芯片、類(lèi)腦芯片等都還處于研發(fā)階段,其技術(shù)成熟度還有待實(shí)踐的檢驗(yàn)。

      此外,量子芯片、光子芯片、類(lèi)腦芯片等都是針對(duì)特定的計(jì)算問(wèn)題而設(shè)計(jì)的,其在通用性、兼容性上,往往還存在著一定的不足,

      例如量子芯片適合解決一些經(jīng)典計(jì)算機(jī)難以解決的重要問(wèn)題。光子芯片適合解決一些高速數(shù)據(jù)處理和傳輸?shù)膯?wèn)題,如光通信、光互連、光計(jì)算等。

      而綜合比較下來(lái),目前最有可能勝出的方案,則是多種芯片模塊組合的超異構(gòu)計(jì)算。

      02 新的賽道

      什么是超異構(gòu)計(jì)算?

      簡(jiǎn)單來(lái)說(shuō),就像是一個(gè)拼圖游戲,把不同的芯片模塊(如CPU、GPU、FPGA等)按照不同的規(guī)則和目標(biāo)來(lái)拼接,形成不同的計(jì)算方案。從而處理不同類(lèi)型的數(shù)據(jù)和工作負(fù)載的技術(shù)。

      超異構(gòu)計(jì)算的目的是實(shí)現(xiàn)計(jì)算的*化,即在性能、功耗、延遲等方面達(dá)到*的平衡。

      在CPU同構(gòu)計(jì)算階段,100%工作由CPU完成;

      但在GPU異構(gòu)階段,80%工作由GPU完成,CPU只完成剩余的20%的工作;

      而在超異構(gòu)計(jì)算階段,則80%的工作由各類(lèi)更高效的DSA完成,GPU只完成剩余20%工作的80%,即16%的工作,剩余的4%交給CPU。

      這里的DSA,是一種針對(duì)特定領(lǐng)域和場(chǎng)景的計(jì)算單元,可以實(shí)現(xiàn)高效的數(shù)據(jù)處理和算法加速。例如神經(jīng)網(wǎng)絡(luò)處理器(NPU)、圖形處理器(GPU)、數(shù)字信號(hào)處理器(DSP)、視覺(jué)處理器(VPU)、安全處理器(SPU)等 。

      這些“術(shù)業(yè)有專(zhuān)攻”的特定芯片可以比傳統(tǒng)的GPU更快、更省電、更小巧、更靈活。

      但同時(shí),由于高度特化的DSA不太適合做其他方面的工作。所以,還需要用到一些GPU和CPU來(lái)輔助和協(xié)調(diào)這些芯片,完成剩下的一些計(jì)算工作。

      這樣,在“專(zhuān)人專(zhuān)職”的分工搭配下,芯片就可以實(shí)現(xiàn)計(jì)算的*化,即在性能、功耗、延遲等方面達(dá)到*的平衡。

      在面對(duì)AI大模型、自動(dòng)駕駛、元宇宙等新興的領(lǐng)域和應(yīng)用場(chǎng)景時(shí),AI要做的事情越來(lái)越多,越來(lái)越難,而傳統(tǒng)的同構(gòu)芯片已經(jīng)跟不上AI的步伐,難以給AI提供足夠的算力和速度。

      而超異構(gòu)計(jì)算可以提供更高的靈活性和可擴(kuò)展性,能夠根據(jù)不同的數(shù)據(jù)和工作負(fù)載,動(dòng)態(tài)地分配和調(diào)度計(jì)算資源,實(shí)現(xiàn)計(jì)算的自適應(yīng)和智能。

      具體來(lái)說(shuō),超異構(gòu)計(jì)算可以分為兩種模式:靜態(tài)超異構(gòu)計(jì)算和動(dòng)態(tài)超異構(gòu)計(jì)算。

      靜態(tài)超異構(gòu)計(jì)算,是指在設(shè)計(jì)階段就確定好各個(gè)處理器之間的分工和協(xié)作方式,適用于一些穩(wěn)定且可預(yù)測(cè)的場(chǎng)景,如視頻編解碼、圖像處理等;

      動(dòng)態(tài)超異構(gòu)計(jì)算是指在運(yùn)行時(shí)根據(jù)實(shí)時(shí)數(shù)據(jù)和工作負(fù)載來(lái)動(dòng)態(tài)地選擇和調(diào)度最合適的處理器,適用于一些更具變化的場(chǎng)景,如云計(jì)算、邊緣計(jì)算、物聯(lián)網(wǎng)等;

      通過(guò)這類(lèi)“動(dòng)靜結(jié)合”的方式,超異構(gòu)計(jì)算就能靈活調(diào)整負(fù)載,實(shí)現(xiàn)高效地算力調(diào)度。

      除此之外,從成本上說(shuō),超異構(gòu)計(jì)算同樣是一種有效降低大算力芯片成本的方案。

      隨著傳統(tǒng)GPU芯片尺寸的不斷縮小,人們就需要更多的研發(fā)投入和更精密的制造設(shè)備,這就導(dǎo)致了成本的上升。

      知名半導(dǎo)體研究機(jī)構(gòu)Semiengingeering統(tǒng)計(jì)了不同工藝下芯片所需費(fèi)用,其中7nm節(jié)點(diǎn)需要的費(fèi)用已經(jīng)達(dá)到了2.97億美元;

      但超異構(gòu)計(jì)算,卻憑借多種芯片間靈活的分工、協(xié)作,巧妙地解決了這一難題。

      用一個(gè)形象的比喻來(lái)說(shuō),傳統(tǒng)GPU芯片就像是一輛跑車(chē),要想讓它跑得更快,就需要不斷地改進(jìn)發(fā)動(dòng)機(jī)、輪胎、剎車(chē)等部件,因而制造成本會(huì)成倍上升。

      而超異構(gòu)計(jì)算就像是一輛多功能汽車(chē),它可以根據(jù)不同的路況和需求,切換不同的驅(qū)動(dòng)模式,如越野、運(yùn)輸、載客等,如此一來(lái),就不用一味地改進(jìn)發(fā)動(dòng)機(jī)(縮小芯片尺寸)來(lái)提高性能了。

      03 彎道超車(chē)

      正是由于這樣的優(yōu)勢(shì),超異構(gòu)計(jì)算不僅突破了傳統(tǒng)GPU的瓶頸,并且也對(duì)了國(guó)產(chǎn)大算力芯片提供了“彎道超車(chē)”的歷史時(shí)機(jī)。

      就目前來(lái)看,在超異構(gòu)計(jì)算的賽道上,英偉達(dá)等巨頭的布局也非常積極和全面,推出了Hopper超級(jí)芯片,與GraceCPU和BluefieldDPU集成,構(gòu)成一個(gè)完整的超異構(gòu)系統(tǒng)。

      但國(guó)內(nèi)廠商也同樣開(kāi)始在這一方向進(jìn)行了發(fā)力,如華為推出了鯤鵬920處理器,這是一款基于ARM架構(gòu)的高性能CPU,可以與華為自研的昇騰 AI 芯片和昆侖 AI 芯片實(shí)現(xiàn)異構(gòu)協(xié)同,支持云、邊、端等多種場(chǎng)景。

      還有一些國(guó)內(nèi)廠商也在研發(fā)自己的超異構(gòu)芯片,例如紫光展銳推出了虎賁 T7520處理器,這是一款集成了CPU、GPU、NPU、ISP等多種計(jì)算單元的超異構(gòu)芯片,專(zhuān)為5G終端而設(shè)計(jì)。

      從總體來(lái)說(shuō),超異構(gòu)計(jì)算是否會(huì)給國(guó)內(nèi)芯片廠商提供彎道超車(chē)的機(jī)會(huì),主要取決于以下幾個(gè)因素:

      ·國(guó)內(nèi)芯片廠商在不同類(lèi)型的計(jì)算單元上的技術(shù)水平和競(jìng)爭(zhēng)力,例如CPU、GPU、DPU、FPGA等,以及它們之間的協(xié)同和優(yōu)化能力。

      ·國(guó)內(nèi)芯片廠商在高速互連和先進(jìn)封裝方面的創(chuàng)新能力和成本控制能力,例如 2.5D和3D堆疊技術(shù),以及對(duì)不同工藝節(jié)點(diǎn)和架構(gòu)的兼容性和可擴(kuò)展性。

      ·國(guó)內(nèi)芯片廠商在統(tǒng)一軟件平臺(tái)方面的開(kāi)發(fā)能力和生態(tài)建設(shè)能力,例如支持多種異構(gòu)設(shè)備的編程框架和管理平臺(tái),對(duì)不同場(chǎng)景和應(yīng)用的適配能力。

      在這三個(gè)方面,目前的國(guó)內(nèi)企業(yè)雖然有一定的探索和進(jìn)展,但總體而言,仍面臨不小的挑戰(zhàn)。

      例如,不同類(lèi)型的計(jì)算單元上的技術(shù)水平上,國(guó)內(nèi)仍存在著一定的短板,例如華為的鯤鵬920處理器雖然在性能上有所提升,但是在兼容性和生態(tài)方面還有不足。

      在高速互連和先進(jìn)封裝方面,對(duì)于2.5D和3D堆疊等關(guān)鍵技術(shù),目前國(guó)內(nèi)芯片廠商還沒(méi)有完全掌握,并且還依賴(lài)于國(guó)外供應(yīng)商。

      而目前國(guó)內(nèi)廠商目前突破*,也*潛力的方向,是軟件平臺(tái)的開(kāi)發(fā)能力上。

      因?yàn),超異?gòu)計(jì)算的硬件多樣性和復(fù)雜性,給開(kāi)發(fā)者帶來(lái)了很大的挑戰(zhàn)。

      如果有一個(gè)統(tǒng)一的軟件平臺(tái),可以屏蔽底層的細(xì)節(jié),提供高效的編譯、調(diào)度、優(yōu)化等功能,那么就可以大大降低開(kāi)發(fā)者的負(fù)擔(dān),提高超異構(gòu)計(jì)算的可用性和普及性。

      現(xiàn)階段,阿里云的異構(gòu)計(jì)算產(chǎn)品家族,包括GPU云服務(wù)器、FPGA云服務(wù)器和彈性加速計(jì)算實(shí)例 EAIS 等,提供了一系列的異構(gòu)計(jì)算服務(wù)和解決方案。

      而華為的Atlas異構(gòu)計(jì)算平臺(tái),基于自研的昇騰AI處理器,也提供了從芯片到云服務(wù)的全棧異構(gòu)計(jì)算解決方案。

      綜合以上各種因素,以及英偉達(dá)自身的研發(fā)能力這一“動(dòng)態(tài)變量”進(jìn)行考慮,未來(lái)芯片市場(chǎng)的競(jìng)爭(zhēng)格局,大致會(huì)呈現(xiàn)如下態(tài)勢(shì):

      國(guó)內(nèi)芯片廠商未來(lái)5年在超異構(gòu)計(jì)算上的競(jìng)爭(zhēng)水平,會(huì)有一定程度的提升和突破,解決部分算力“卡脖子”問(wèn)題,但是還無(wú)法完全擺脫對(duì)英偉達(dá)等國(guó)外巨頭的依賴(lài)。

      在一些特定的場(chǎng)景和應(yīng)用上,國(guó)內(nèi)芯片廠商可以與英偉達(dá) 等巨頭形成有效的競(jìng)爭(zhēng),例如在5G、物聯(lián)網(wǎng)、邊緣計(jì)算等領(lǐng)域,國(guó)內(nèi)芯片廠商可能會(huì)推出更適合本地化需求和環(huán)境的超異構(gòu)計(jì)算解決方案。

      可以說(shuō),超異構(gòu)計(jì)算,確實(shí)為國(guó)產(chǎn)芯片的“算力之困”撕開(kāi)了一道口子,但從長(zhǎng)遠(yuǎn)來(lái)看,要想完全解決“卡脖子”問(wèn)題,并與英偉達(dá)等巨頭形成對(duì)等競(jìng)爭(zhēng),仍是一個(gè)任重道遠(yuǎn)的過(guò)程。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類(lèi)目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性?xún)r(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專(zhuān)題論壇在沈陽(yáng)成功舉辦。