為啥性能最好的開(kāi)源CPU是中國(guó)的?
就這兩天,海外大V的一條發(fā)問(wèn),在國(guó)外科技圈引發(fā)廣泛熱議。
這條信息兩天內(nèi)就吸引了超過(guò)50萬(wàn)次閱讀、點(diǎn)贊量超5k。
Hackernews上也掀起了相關(guān)討論。
“香山”處理器的GitHub Star在2天內(nèi)迎來(lái)了一波暴漲。
而這個(gè)CPU說(shuō)的不是別人,正是中科院計(jì)算技術(shù)所的核心成果,國(guó)產(chǎn)自研CPU:香山。
被熱議和討論的還不止CPU本身,也包括背后的項(xiàng)目:一生一芯。
老外感嘆:中國(guó)人正在一磚一瓦建設(shè)核心工程。
背后自然是認(rèn)可,所以項(xiàng)目核心負(fù)責(zé)人,中科院計(jì)算所研究院包云崗教授也表達(dá)了感慨:
這是對(duì)香山項(xiàng)目的一種肯定。
已知性能最強(qiáng)的開(kāi)源處理器
簡(jiǎn)單來(lái)說(shuō),這次“香山”項(xiàng)目爆火出圈有點(diǎn)意外。
發(fā)布該推特的大V George Hotz是開(kāi)源自動(dòng)駕駛公司Comma AI的總裁,日常對(duì)芯片硬件領(lǐng)域非常關(guān)注。前段時(shí)間他給AMD替代CUDA的方案挑出了bug。
他推特中提及的“開(kāi)源最強(qiáng)”,追溯數(shù)據(jù)可以追溯到2024RISC-V歐洲峰會(huì)上,香山最新版本“昆明湖”在SPECint2006測(cè)試中,以3GHz的頻率達(dá)到了標(biāo)準(zhǔn)化分?jǐn)?shù)45。
其性能可以媲美ARM Neoverse N2,是目前已知性能最強(qiáng)的開(kāi)源處理器。
有人表示,盡管很難找到先進(jìn)版本x86和ARM內(nèi)核的SPECint2006分?jǐn)?shù),因?yàn)樗鼈兌际褂肞ECint2017,最后的時(shí)鐘頻率也會(huì)有比較大影響;但由于“昆明湖”是在3GHz下,所以表現(xiàn)是相當(dāng)不錯(cuò)的。
事情引發(fā)熱議后,中科院計(jì)算技術(shù)研究所研究員包云崗也在知乎發(fā)表回應(yīng)。
包云崗表示,香山開(kāi)源CPU項(xiàng)目已經(jīng)啟動(dòng)5年,現(xiàn)在隨著產(chǎn)業(yè)發(fā)展,更加堅(jiān)定了開(kāi)源CPU這個(gè)信念。
目前,香山項(xiàng)目已經(jīng)取得了一定進(jìn)展。
性能上可以媲美ARM Neoverse N2,同時(shí)也已集齊了產(chǎn)業(yè)落地的“八大金剛”企業(yè)客戶。
原回答如下:(上下滑動(dòng)查看所有內(nèi)容):
透過(guò)這一最新回應(yīng),香山項(xiàng)目的發(fā)展脈絡(luò)也更加清晰地呈現(xiàn)出來(lái)。
香山項(xiàng)目的啟動(dòng)可以追溯到2019年。
包云崗和團(tuán)隊(duì)的唐丹博士一直認(rèn)為要建立一個(gè)像Linux那樣的開(kāi)源RISC-V核主線,既能被工業(yè)界廣泛應(yīng)用,又能支持學(xué)術(shù)界試驗(yàn)創(chuàng)新想法。
于是在中國(guó)科學(xué)院支持下,由中國(guó)科學(xué)院計(jì)算技術(shù)研究所牽頭發(fā)起了“香山”高性能開(kāi)源RISC-V處理器項(xiàng)目。
之后團(tuán)隊(duì)做了一年多的準(zhǔn)備工作,直到2020年6月,香山處理器的正式開(kāi)發(fā)工作開(kāi)始,GitHub代碼倉(cāng)庫(kù)也隨之建立,之后在深圳鵬城實(shí)驗(yàn)室完成了主要的物理設(shè)計(jì)流程。
據(jù)介紹,流水線前端、后端、訪存流水線、L1Cache、L2/L3Cache 等在內(nèi)的關(guān)鍵代碼均由香山團(tuán)隊(duì)獨(dú)立實(shí)現(xiàn)。
一年多之后,香山處理器第一版(雁棲湖架構(gòu))在2021年7月投片。
雁棲湖架構(gòu)面向單核場(chǎng)景,支持RV64GC指令集,在28nm的工藝節(jié)點(diǎn)下達(dá)到1.3GHz的頻率。
2022年1月,雁棲湖芯片回片并成功點(diǎn)亮,能夠正確運(yùn)行Linux/Debian等復(fù)雜操作系統(tǒng)。
這中間,2021年12月,香山的研發(fā)團(tuán)隊(duì)也進(jìn)一步發(fā)展壯大,與16家機(jī)構(gòu)聯(lián)合成立了北京開(kāi)源芯片研究院,進(jìn)行香山處理器核的產(chǎn)品化改造和后續(xù)架構(gòu)研發(fā)。
在第一代投片前的兩個(gè)月,第二代香山芯片——南湖的設(shè)計(jì)工作也已經(jīng)啟動(dòng)。
南湖V1版本面向雙核場(chǎng)景, 支持RV64GCBK指令集,于2023年11月投片,在14nm工藝節(jié)點(diǎn)下頻率達(dá)到2GHz。
南湖V2版本則包含了MBIST等改進(jìn)設(shè)計(jì),于2023年4月投片,同年10月回片并成功點(diǎn)亮啟動(dòng)Linux。
南湖V3版本將包含更多的微結(jié)構(gòu)、PPA改進(jìn),目前項(xiàng)目正在進(jìn)行中。
2022年8月24日,中科院計(jì)算所、北京開(kāi)源芯片研究院、騰訊、阿里、中興通訊等成立了聯(lián)合研發(fā)團(tuán)隊(duì),正式開(kāi)展第三代香山(昆明湖架構(gòu))的聯(lián)合開(kāi)發(fā)。
昆明湖的設(shè)計(jì)探索,以及南湖的產(chǎn)品化,自此被確立為香山項(xiàng)目接下來(lái)的兩項(xiàng)工作重點(diǎn)。
去年8月的第4屆RISC-V中國(guó)峰會(huì)上,基于南湖的開(kāi)發(fā)板正式亮相,并成功運(yùn)行了《云·原神》。
而根據(jù)團(tuán)隊(duì)發(fā)布的雙周報(bào)顯示,2023年11月,昆明湖的研發(fā)已經(jīng)接近尾聲,此表述最后一次在雙周報(bào)中出現(xiàn)是在去年4月。
在此之后的雙周報(bào)顯示,昆明湖各組正在持續(xù)推進(jìn)面積、時(shí)序、功耗的優(yōu)化。
不過(guò)目前,香山處理器還沒(méi)有實(shí)現(xiàn)量產(chǎn)。
官方表示,香山將保持半年左右的微結(jié)構(gòu)迭代周期、流片周期,除了微結(jié)構(gòu)之外,還希望探索并建立一套高性能處理器的敏捷開(kāi)發(fā)流程。
官方文檔詳解香山微結(jié)構(gòu)
從技術(shù)角度看,香山處理器選用了Chisel硬件描述語(yǔ)言,微架構(gòu)采用了亂序六發(fā)射結(jié)構(gòu)、訪存子系統(tǒng)分離的設(shè)計(jì)。
研發(fā)團(tuán)隊(duì)將訪存子系統(tǒng)分離開(kāi),包括兩條load流水線,兩條store addr流水線,兩條store data流水線,以及獨(dú)立的load隊(duì)列和store隊(duì)列,store buffer等。
目前南湖微架構(gòu)的技術(shù)文檔已經(jīng)完整公布,整體結(jié)構(gòu)如下:
具體來(lái)說(shuō),香山處理器前端流水線包括分支預(yù)測(cè)單元、取指單元、指令緩沖等單元,順序取指。
南湖架構(gòu)采取了一種分支預(yù)測(cè)和指令緩存解耦的取指架構(gòu),分支預(yù)測(cè)單元提供取指請(qǐng)求,寫(xiě)入一個(gè)隊(duì)列,該隊(duì)列將其發(fā)往取指單元,送入指令緩存。
取出的指令碼通過(guò)預(yù)譯碼初步檢查分支預(yù)測(cè)的錯(cuò)誤并及時(shí)沖刷預(yù)測(cè)流水線,檢查后的指令送入指令緩沖并傳給譯碼模塊,最終形成后端的指令供給。
后端包括譯碼、重命名、重定序緩沖、保留站、整型/浮點(diǎn)寄存器堆、整型/浮點(diǎn)運(yùn)算單元。
處理器的流水線后端負(fù)責(zé)指令的重命名與亂序執(zhí)行。
如下圖所示,香山處理器(南湖)后端可以分為CtrlBlock、IntBlock、FloatBlock、Memblock這4個(gè)部分。
CtrlBlock負(fù)責(zé)指令的譯碼、重命名和分派, IntBlock、FloatBlock、MemBlock分別負(fù)責(zé)整數(shù)、浮點(diǎn)、訪存指令的亂序執(zhí)行。
(在第三代香山處理器即昆明湖的后端還新增了VectorBlockworlds,負(fù)責(zé)向量的處理)
香山處理器的MemBlock包含核內(nèi)的訪存流水線及隊(duì)列,以及與訪存流水線緊耦合的一級(jí)數(shù)據(jù)緩存。
其中包含兩條load流水線,彼此分離的兩條sta流水線和兩條std流水線,load和store流水線分別負(fù)責(zé)維護(hù)訪存指令的順序信息。
最新的昆明湖架構(gòu)還沒(méi)有詳細(xì)的技術(shù)文檔,但團(tuán)隊(duì)已經(jīng)公布了整體的架構(gòu)圖。
可以看出其結(jié)構(gòu)整體上與南湖相似,但后端的各個(gè)Block中的具體實(shí)現(xiàn)也有不少變化,還增加了一個(gè)處理向量的Block,另外部分環(huán)節(jié)的緩存容量也有提升。
開(kāi)源協(xié)議方面,香山采用木蘭寬松許可證第2版,堅(jiān)持開(kāi)放全部設(shè)計(jì)源碼和流程,并歡迎來(lái)自社區(qū)的貢獻(xiàn)。
網(wǎng)友:中國(guó)正在一磚一瓦建設(shè)核心工程能力
“香山”項(xiàng)目意外翻紅,也把海外網(wǎng)友給整焦慮了。
在評(píng)論中,還有人非?隙ǖ乇硎:這正意味著中國(guó)在解決基本硬件問(wèn)題。
在硅谷還在資助一波硬件初創(chuàng)企業(yè)時(shí),中國(guó)正在一磚一瓦建設(shè)核心工程能力。
……
難題才是吸引真正人才的關(guān)鍵。
有人就說(shuō)了,美國(guó)最好的芯片架構(gòu)師都在英偉達(dá)和蘋(píng)果,沒(méi)人搞開(kāi)源。
甚至還有人上升到,如果邏輯和數(shù)學(xué)是中國(guó)的強(qiáng)項(xiàng),那這將如何影響計(jì)算機(jī)的未來(lái)呢?
還有人扒到了“一生一芯”計(jì)劃:
這里提到的其實(shí)是中國(guó)科學(xué)院大學(xué)在2019年啟動(dòng)的一項(xiàng)計(jì)劃。
簡(jiǎn)單來(lái)說(shuō),就是以流片為目標(biāo),讓本科生主導(dǎo)完成一款64位RISC-V處理器SoC芯片設(shè)計(jì)并實(shí)現(xiàn)流片,芯片能成功運(yùn)行Linux操作系統(tǒng)以及學(xué)生自己編寫(xiě)的國(guó)科大教學(xué)操作系統(tǒng)UCAS-Core。
首批參與計(jì)劃的學(xué)生只有5人,經(jīng)歷幾年,規(guī)模已逐漸擴(kuò)大到6000余人。
這個(gè)計(jì)劃的核心目標(biāo)就是在“開(kāi)源共享”的理念下,突破傳統(tǒng)課程邊界,縮短人才從培養(yǎng)階段到投入科研與產(chǎn)業(yè)一線的周期。
類似的模式可以參考上世紀(jì)在MIT風(fēng)靡一時(shí)的Mead-Conway式培訓(xùn),它也是主打讓學(xué)生全流程設(shè)計(jì)制造芯片。后來(lái),很多學(xué)生就拿著自己的課程設(shè)計(jì)奔赴硅谷創(chuàng)業(yè)。
總之,在2025的開(kāi)年,國(guó)產(chǎn)開(kāi)源開(kāi)始頻繁刷屏。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。