2020年底的一天,吳強(qiáng)與幾個同事加完班,一同去沙縣小吃吃夜宵。餛飩的蒸汽氤氳,吳強(qiáng)問同事:“如果你們可以自己選一個領(lǐng)域做芯片,你希望用芯片做出解決什么問題的產(chǎn)品?”
幾位同事紛紛說起自己的現(xiàn)狀。有人每天要駕車橫穿大半個城市去上班,希望自動駕駛能讓自己在途中休息一下;有人希望用教育機(jī)器人幫自己教孩子;還有的人希望用機(jī)器人陪伴自己的父母。
同事的回答更堅(jiān)定了吳強(qiáng)的創(chuàng)業(yè)決心:用底層的技術(shù)創(chuàng)新,做一款“更好的AI芯片”——一款可以幫助萬物皆智能的AI芯片。
兩年半之后的5月10日,吳強(qiáng)和后摩智能團(tuán)隊(duì)交上了*塊大算力AI芯片——鴻途H30。這款芯片專注于自動駕駛領(lǐng)域,最高物理算力256TOPS,典型功耗35W。
后摩智能鴻途H30的獨(dú)特之處在于“存算一體”的新型架構(gòu)設(shè)計(jì)。在吳強(qiáng)看來,鴻途H30證明了大算力存算一體技術(shù)的可用性,標(biāo)志著存算一體芯片商業(yè)化元年的到來。同時,存算一體也讓車企客戶多了一個優(yōu)質(zhì)國產(chǎn)芯片的選擇,并證明了不依賴先進(jìn)工藝,依舊能做出算力、功耗都優(yōu)秀的芯片。
借著新產(chǎn)品發(fā)布會,「甲子光年」采訪了后摩智能創(chuàng)始人兼CEO吳強(qiáng),以及投資后摩智能三輪的投資人、經(jīng)緯創(chuàng)投投資董事童倜,聊聊這款大算力存算一體芯片是怎么做出來的。
1. 用“存算一體”來做自動駕駛芯片
2014年,已經(jīng)發(fā)布了自動駕駛乘用車的特斯拉,宣布與Mobileye合作,在后續(xù)的產(chǎn)品中使用EYE Q3芯片。該款芯片在當(dāng)時是算力*,為0.256TOPS,也即每秒可計(jì)算0.256萬億次。短短兩年之后的2016年,特斯拉拋棄Mobileye,換上英偉達(dá)8TOPS的芯片Drive PX 2。
2019年,特斯拉結(jié)束與英偉達(dá)的合作,發(fā)布了自研的芯片,目前特斯拉最高算力的芯片已經(jīng)達(dá)到144TOPS,而英偉達(dá)去年11月發(fā)布的Thor芯片更是一路讓算力飆升到了2000TOPS。
但算力之外,距離規(guī);占皯(yīng)用,自動駕駛芯片還有一些鴻溝需要跨越——功耗與成本。
過往,芯片設(shè)計(jì)主要通過工藝制程的精進(jìn)來提升能效比,但隨著摩爾定律逐漸趨緩,通過工藝節(jié)點(diǎn)來優(yōu)化功耗的效果收效甚微。同時,工藝節(jié)點(diǎn)的優(yōu)化也會指數(shù)級地增加芯片生產(chǎn)的成本。算力、功耗和成本成了“不可能三角”。
但著名芯片設(shè)計(jì)師Jim Keller卻說,“如果通過常規(guī)方法無法改良一款芯片,那就去做底層的架構(gòu)創(chuàng)新”。也是受到這句話的鼓舞,一直想做一款高能效比且大算力計(jì)算芯片的吳強(qiáng),下定決心要用更前沿的“存算一體”架構(gòu)來重新設(shè)計(jì)芯片。
什么是存算一體?
從字面意思來理解,就是芯片內(nèi)部的存儲模塊和計(jì)算模塊融合在了一起,數(shù)據(jù)在存儲模塊中完成了部分或全部的計(jì)算。
如果把一塊芯片的計(jì)算功能想象成廚師做菜,那計(jì)算模塊就是廚房,而存儲模塊是倉庫。過去,廚師需要根據(jù)指令,每次都去倉庫拿出一件東西來到廚房,再接著讀下一條指令拿另一件東西,或讀完指令來餐廳進(jìn)行一個步驟。這樣不僅傳輸繁瑣,也浪費(fèi)了很多時間。
應(yīng)用存算一體技術(shù),也即直接把廚房移到倉庫中,數(shù)據(jù)可以在存算模塊內(nèi)部完成大部分的計(jì)算,再傳輸出去進(jìn)行進(jìn)一步的運(yùn)算。
“存算一體”技術(shù)屬于底層架構(gòu)的創(chuàng)新,有一些顯著的優(yōu)勢。由于計(jì)算不再需要每一步分別讀寫,所以整體的計(jì)算速度會變快,計(jì)算延時也更低。
存算一體的另一個優(yōu)勢是功耗顯著降低。同樣由于數(shù)據(jù)傳輸路徑的優(yōu)化,存算一體技術(shù)不僅節(jié)省了時間,還節(jié)省了數(shù)據(jù)傳輸?shù)?ldquo;內(nèi)耗”,帶來更好的能效比。
更重要的是,當(dāng)芯片在保證算力的同時又能兼顧能效比,它也有機(jī)會用更成熟的工藝節(jié)點(diǎn)來制造。這不僅會帶來成本上的優(yōu)勢,在國產(chǎn)化的趨勢下,也更有可能保證供應(yīng)鏈穩(wěn)定,被客戶優(yōu)先選擇。
在吳強(qiáng)看來,由于摩爾定律趨緩,需要更新的技術(shù)創(chuàng)新。而那些能夠在不依賴先進(jìn)工藝而實(shí)現(xiàn)瓶頸突破的底層技術(shù)創(chuàng)新,就是后摩爾時代的技術(shù)方向。
也正因此,團(tuán)隊(duì)一致同意給公司起名“后摩智能”。
2.存算一體芯片“最后七公里”
盡管存算一體在技術(shù)層面能夠支撐芯片產(chǎn)業(yè)出現(xiàn)新機(jī)會,但要真正創(chuàng)業(yè)做新業(yè)務(wù)卻沒有那么容易。在吳強(qiáng)看來,存算一體還有“最后七公里”要走。
“學(xué)術(shù)上實(shí)現(xiàn)的是從無到有的過程,但要應(yīng)用在商業(yè),還需要先補(bǔ)齊技術(shù)的可實(shí)現(xiàn)性這兩公里,再補(bǔ)上應(yīng)用到具體場景的工程性問題這五公里。”
具體而言,在這款芯片的定義、設(shè)計(jì)過程中,也經(jīng)過了不少討論和取舍。
例如,存算一體技術(shù)依托的存儲類型非常豐富,包括以SRAM、DRAM為代表的易失性存儲器,以Flash為代表的非易失性存儲器,還有以MRAM和RRAM為代表的新型非易失性存儲器。后摩當(dāng)前選擇了制作工藝更為成熟的SRAM。
又如,從電路技術(shù)來看,存內(nèi)計(jì)算有數(shù)字計(jì)算和模擬計(jì)算兩種,后摩首先選擇了運(yùn)算精度更高、可靠性更好的數(shù)字存算。
但對吳強(qiáng)來說,這都是綜合市場需求和技術(shù)可行性之后的更優(yōu)選擇,后摩當(dāng)下戰(zhàn)略聚焦于智能駕駛芯片,更大的有效算力、更高的可靠性都是為目標(biāo)芯片服務(wù)的。
只不過,摸著石頭過河,確實(shí)要面臨比同行更多的挑戰(zhàn)。
比如在電路的仿真驗(yàn)證中,一般用EDA軟件進(jìn)行在線的設(shè)計(jì),而后用可編程的FPGA進(jìn)行電路設(shè)計(jì)的驗(yàn)證。但是,后摩智能的芯片設(shè)計(jì)規(guī)模已經(jīng)超過了市面上任何一個可以找到的FPGA,要怎么做芯片驗(yàn)證呢?
后摩智能想到把芯片的不同功能進(jìn)行切割,在不同的FPGA上進(jìn)行驗(yàn)證。關(guān)于如何把芯片做合理的剪裁以適應(yīng)部分的驗(yàn)證,后摩團(tuán)隊(duì)反復(fù)討論、多次嘗試,最終找到了最恰當(dāng)?shù)姆椒ā?/p>
最終,后摩智能交上了鴻途H30這份答卷,相比業(yè)界先進(jìn)的7nm工藝,后摩采用了更成熟的12nm工藝,但功耗比前者減少了50%,性能有兩倍以上的提升。
經(jīng)緯創(chuàng)投投資董事童倜認(rèn)為,除了存算一體技術(shù)上有巨大的優(yōu)勢之外,“后摩團(tuán)隊(duì)的優(yōu)勢還在于團(tuán)隊(duì)的人員構(gòu)成非常完善,在很早就擁有了存算一體相關(guān)領(lǐng)域的學(xué)術(shù)專家、曾經(jīng)量產(chǎn)過大算力AI芯片的人,和設(shè)計(jì)過車規(guī)芯片的人”。
在童倜看來,尤為難得的是,在創(chuàng)立之初,后摩團(tuán)隊(duì)就已經(jīng)對所在的賽道、市場需求有了清醒的認(rèn)知,也對整個芯片研發(fā)及企業(yè)經(jīng)營中可能會遇到的問題有了一定的預(yù)期和規(guī)劃。
這或許要?dú)w功于吳強(qiáng)及后摩團(tuán)隊(duì)過往在芯片行業(yè)豐富的從業(yè)經(jīng)驗(yàn),有十年以上芯片行業(yè)的工作經(jīng)驗(yàn)的研發(fā)人員占比很高,經(jīng)歷過車規(guī)芯片量產(chǎn)和導(dǎo)入的初創(chuàng)企業(yè)奮斗全過程的員工也不在少數(shù),他們能夠深刻理解研發(fā)組織、客戶溝通等的重要性。
3. “科學(xué)家”創(chuàng)業(yè),挑戰(zhàn)在技術(shù)之外
技術(shù)之外,創(chuàng)業(yè)更大的挑戰(zhàn)正在等待著吳強(qiáng)——技術(shù)商業(yè)化。
縱觀后摩創(chuàng)始團(tuán)隊(duì)的背景,技術(shù)出身占比更多,吳強(qiáng)在先前AI芯片公司做CTO的時候也主要是專注于技術(shù)領(lǐng)域。但他并不覺得這是一個難以跨越的挑戰(zhàn),“雖然這些我以前沒有做過,但這都是身為CEO應(yīng)該做的。創(chuàng)業(yè)本來就是快速學(xué)習(xí)、快速成長的過程,因?yàn)槟悴粔蚩炀蜁惶蕴?rdquo;。
在后摩成立半年左右的2021年中,公司還在芯片定義階段,吳強(qiáng)已經(jīng)開始拜訪客戶。他認(rèn)為,未來產(chǎn)品落地過程中必須要關(guān)注客戶真實(shí)的場景和訴求,所以何不在最開始就讓客戶的訴求加入到“芯片定義”環(huán)節(jié)呢?
讓吳強(qiáng)印象最深的是一次去一家傳統(tǒng)車企,當(dāng)時接待他的采購負(fù)責(zé)人畢業(yè)就在這里工作,已經(jīng)有十多年。他和吳強(qiáng)解釋他們高、中、低款車型對自動駕駛芯片不同的預(yù)算、功能訴求,又拉著吳強(qiáng)感嘆“如果你們有芯片,我們現(xiàn)在就能上車測試”。
詢問其中原因后才發(fā)現(xiàn),中小車企其實(shí)“苦國外車規(guī)芯片久矣”。
一方面,由于自動駕駛芯片技術(shù)難度不低,很多車企只能成為大型芯片公司的客戶。那些公司的芯片不僅價格高昂,而且總是先供應(yīng)更頭部的車廠,中小企業(yè)總是會被遲發(fā)、少發(fā)芯片。并且,這些公司售后技術(shù)團(tuán)隊(duì)在國內(nèi)的員工較少,也很難保證每一家車企都提供完整的售后技術(shù)支持。
更重要的是,在地緣政治等全球不穩(wěn)定的因素下,中國的中小車企也希望能夠保證自己產(chǎn)線的供應(yīng)鏈安全,而自動駕駛芯片作為核心零部件之一,國產(chǎn)化的趨勢勢不可擋。
于是,后摩團(tuán)隊(duì)*款芯片在驗(yàn)證階段就根據(jù)客戶痛點(diǎn)規(guī)劃了許多功能,并在去年完成了核心功能驗(yàn)證。
除了鴻途H30之外,本次發(fā)布會還一下子發(fā)布了智能駕駛計(jì)算使能平臺Sailing平臺、智能駕駛硬件平臺力馭、軟件開發(fā)工具鏈后摩大道。后摩智能聯(lián)合創(chuàng)始人、產(chǎn)品副總裁信曉旭提到,后摩一家芯片公司這么早就投入人力物力來做軟件平臺,是因?yàn)閳F(tuán)隊(duì)成員里不少過去曾因?yàn)檐浖氖虑槌赃^虧。
“我曾在一家知名芯片公司負(fù)責(zé)某標(biāo)桿客戶的項(xiàng)目落地。原本項(xiàng)目進(jìn)展很順利,但三個月之后,對方的負(fù)責(zé)人忽然打電話來終止了合作,原因是團(tuán)隊(duì)覺得軟件平臺太難用、學(xué)習(xí)成本太高。”信曉旭表示。
于是在后摩產(chǎn)品的設(shè)計(jì)之初,就把軟件作為重要的產(chǎn)品線,與硬件設(shè)計(jì)同步推進(jìn)。
目前,后摩團(tuán)隊(duì)正在做給客戶送樣前的最后測試,預(yù)計(jì)6月,客戶就會收到樣片進(jìn)行測試。
4. 大模型時代,存算一體不止于自動駕駛
存算一體只能用在自動駕駛領(lǐng)域嗎?
后摩智能聯(lián)合創(chuàng)始人、芯片研發(fā)副總裁陳亮在發(fā)布會上的回答是“存算一體還有更廣闊的應(yīng)用場景”。
陳亮表示,鴻途H30 以存算一體創(chuàng)新架構(gòu)實(shí)現(xiàn)了六大技術(shù)突破,即大算力、全精度、低功耗、車規(guī)級、可量產(chǎn)、通用性。
鴻途H30 基于 SRAM 存儲介質(zhì),采用數(shù)字存算一體架構(gòu),擁有極低的訪存功耗和超高的計(jì)算密度,在 Int8 數(shù)據(jù)精度條件下,其 AI 核心 IPU 能效比高達(dá)15Tops/W,是傳統(tǒng)架構(gòu)芯片的7倍以上。在實(shí)際性能測試中,鴻途H30 基于Resnet 50 模型的 Benchmark,在 Batch Size 等于1 和 8 的條件下分別達(dá)到了8700 幀/秒和10300 幀/秒的性能。
而為了充分發(fā)揮存算一體帶來的高計(jì)算效率,后摩智能面向智能駕駛場景打造了專用 IPU(處理器架構(gòu))——天樞架構(gòu),采用多核、多硬件線程的方式擴(kuò)展算力,實(shí)現(xiàn)了計(jì)算效率與算力靈活擴(kuò)展的*均衡,AI 計(jì)算可以在核內(nèi)完成端到端處理,保證通用性。
天樞架構(gòu)的設(shè)計(jì)理念源自于庭院式的中國傳統(tǒng)住宅,以大布局設(shè)計(jì)保障計(jì)算資源利用效率的同時,再進(jìn)一步結(jié)合現(xiàn)代住宅多層/高層的設(shè)計(jì)優(yōu)勢,以多核/多硬件線程的方式靈活擴(kuò)展算力。
后摩智能的存算一體芯片在大算力、低功耗、通用性上的優(yōu)勢,為未來芯片應(yīng)用在更多領(lǐng)域帶來了可能。
不過,作為一個在“能效比”上更有優(yōu)勢的底層架構(gòu),后摩智能更希望未來的芯片專注于那些較大算力且對功耗較為敏感的場景。例如一些邊緣側(cè)的重點(diǎn)場景,如智慧工業(yè)中的數(shù)據(jù)分析+設(shè)備控制、擁有較多功能的服務(wù)機(jī)器人、用來探測和計(jì)算的商用無人機(jī)、更多功能性能更強(qiáng)的ARVR等。
吳強(qiáng)認(rèn)為,能效比每提升1000倍都會延伸出一個新的計(jì)算形態(tài)。例如從小型機(jī)時代到PC時代,以及從PC時代到手機(jī)時代,都提升了接近1000倍。而后摩智能的未來的愿景,則是希望通過不斷迭代,產(chǎn)生出千倍于手機(jī)時代的能效比,創(chuàng)造可能的新計(jì)算形態(tài)。
不過更近一點(diǎn),后摩智能還是希望在未來1~3年里,聚焦智能駕駛場景,關(guān)注乘用車和商用車的使用情況,打通商業(yè)閉環(huán),“做透”一個場景。
經(jīng)緯創(chuàng)投投資董事童倜在評價投資后摩智能的時候曾這樣對「甲子光年」說,“我們關(guān)注一項(xiàng)新技術(shù),不會等到80%或90%的技術(shù)成熟度或要求有商業(yè)落地案例才投資,因?yàn)槟菚r候已經(jīng)太晚了”。而類似后摩智能這樣的先行者,已經(jīng)早早出發(fā),成為新技術(shù)落地過程的核心推動者,并在技術(shù)爆發(fā)之后“坐看云起”。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。