他在現(xiàn)場(chǎng)只是播放了一張的演講內(nèi)容。
竟引得眾人不約而同,紛紛高舉手機(jī)拍照,會(huì)場(chǎng)更是掌聲不斷。
他叫錢軍,很多人熟知這個(gè)名字,是因?yàn)樗?strong>AMD擔(dān)任高管一職長(zhǎng)達(dá)近10年時(shí)間。
在此期間,錢軍還帶領(lǐng)團(tuán)隊(duì)設(shè)計(jì)量產(chǎn)了兩個(gè)業(yè)界第 一:
第 一顆7nm圖形處理器
第 一顆7nm GPGPU架構(gòu)的AI芯片
而剛才現(xiàn)場(chǎng)之所以會(huì)有那般反響,正是因?yàn)殄X軍在2018年所成立的瀚博半導(dǎo)體,搞了一個(gè)“大動(dòng)作”——
預(yù)覽了國(guó)產(chǎn)7nm云端GPU芯片,SG100。
據(jù)了解,SG100是集渲染、AI和視頻于一體的全功能GPU,在吞吐、延時(shí)等性能中具備*水平。
至于它所要發(fā)力的領(lǐng)域,正是云游戲、云手機(jī)、云桌面、云計(jì)算等元宇宙關(guān)鍵性應(yīng)用場(chǎng)景。
例如在現(xiàn)場(chǎng),錢軍便演示了在SG100加持下視頻渲染的效果對(duì)比:
不難看出,在色彩、幀率、細(xì)節(jié)、光照等方面,都是要優(yōu)于世面主流GPU芯片。
并且隨著SG100的預(yù)覽,也就意味著國(guó)產(chǎn)GPU玩家隊(duì)伍,又正式添加一位新成員。
但縱觀整場(chǎng)發(fā)布會(huì),“業(yè)界*”、“性能數(shù)倍”等標(biāo)簽顯得格外醒目。
之前以“擁有18年以上高端芯片設(shè)計(jì)和量產(chǎn)經(jīng)驗(yàn)”先聲奪人的瀚博半導(dǎo)體,再次來(lái)到聚光燈下。
適應(yīng)多樣化計(jì)算需求:芯片、計(jì)算架構(gòu)、軟件平臺(tái)
在錢軍看來(lái),芯片及其衍生的產(chǎn)品,從來(lái)不是“單打獨(dú)斗”的存在。
相反,他認(rèn)為芯片性能的強(qiáng)大,應(yīng)當(dāng)是源自底層計(jì)算架構(gòu)。
為此,瀚博半導(dǎo)體在現(xiàn)場(chǎng)率先亮出的便是自研的統(tǒng)一計(jì)算架構(gòu)——VUCA(Vastai Unified Compute Architecture)。錢軍表示:
我們用了中臺(tái)的概念。核心的IP就類似中臺(tái),然后上層有統(tǒng)一的開(kāi)發(fā)平臺(tái)?梢愿鶕(jù)產(chǎn)品和規(guī)劃和側(cè)重點(diǎn),設(shè)計(jì)和推出更符合市場(chǎng)需求的產(chǎn)品。
而這張全景圖,可以說(shuō)是貫穿了瀚博半導(dǎo)體的多項(xiàng)核心技術(shù)。
例如架構(gòu)的底層整合了多款高性能計(jì)算引擎,包括高性能AI引擎、可編程的矢量計(jì)算引擎,還有硬件化視頻解碼、具備渲染能力的顯示核心等。
在這些計(jì)算引擎之上,擁有一個(gè)高效統(tǒng)一的存儲(chǔ)管理、一致性的接口和低延遲的鏈接。
之所以如此設(shè)計(jì),是因?yàn)樾酒捌洚a(chǎn)品單單有算力是不夠的,接口、數(shù)據(jù)等因素依舊會(huì)成為制約算力效能的羈絆。
除此之外,要想讓算力資源效能更大化,它還需要被池化、在云端被集中;因此,瀚博半導(dǎo)體的統(tǒng)一計(jì)算架構(gòu)還設(shè)置了完整的虛擬化功能。
而配合的統(tǒng)一的底層軟件設(shè)計(jì)、模塊化的上層計(jì)算算子庫(kù)和功能模塊,則會(huì)讓芯片及產(chǎn)品在面對(duì)不同客戶的需求時(shí),變得更加靈活。
整體而言:
瀚博統(tǒng)一架構(gòu)讓計(jì)算密集型的AI、視頻、渲染任務(wù)性能得到*化硬件加速,同時(shí)端到端縮小延時(shí),一體化助力云端實(shí)時(shí)圖形渲染、AI增強(qiáng)處理、視頻編解碼等需求。
也正是基于這樣的統(tǒng)一架構(gòu),錢軍在現(xiàn)場(chǎng)發(fā)布了瀚博半導(dǎo)體的更多新品。
數(shù)據(jù)中心推理加速卡——載天VA10
載天VA10是一款用于數(shù)據(jù)中心的高性能AI計(jì)算、推理的加速卡。
從性能角度來(lái)看,載天VA10所擁有的*亮點(diǎn),在于INT8峰值算力達(dá)400TOPS!
這一數(shù)值便一舉刷新業(yè)界紀(jì)錄。
但若是僅憑借算力峰值來(lái)判斷加速卡的強(qiáng)弱,那還是有一些片面,需要的更多的綜合性比較。
比如要考慮“算力密度”,算力密度可以從兩個(gè)維度來(lái)講。
*是按芯片單元面積將算力平均下來(lái),比如一平方毫米芯片的算力如何。另外一個(gè),是每單元瓦的算力,也即每瓦功耗能夠提供多大的算力。
例如載天VA10的設(shè)計(jì)功耗為150W,而在同等條件之下:
*吞吐率是主流GPU的2倍以上
*性能延時(shí)是主流GPU的6%
不僅如此,在低延時(shí)場(chǎng)景(低于4毫秒的YoloV3檢測(cè)算法場(chǎng)景)下,載天VA10的推理性能,更達(dá)到同功耗市場(chǎng)主流GPU的3倍以上。
也正是得益于載天VA10的如此性能,它便非常適合“上崗”一些需要高實(shí)時(shí)性的云端AI場(chǎng)景,例如直播視頻增強(qiáng)、智慧交通管理、實(shí)時(shí)語(yǔ)義理解等。
以智能ROI優(yōu)化為例,載天VA10的效果。
不難看出,無(wú)論是實(shí)時(shí)處理效率,亦或是色彩增強(qiáng)效果,載天VA10都是肉眼可見(jiàn)的更勝一籌。
邊緣AI推理加速卡——載天VE1
除了數(shù)據(jù)中心端,瀚博半導(dǎo)體聚焦在邊緣端同樣發(fā)布了新品,載天VE1。
不同于載天VA10,載天VE1更側(cè)重的發(fā)力點(diǎn),是在那些大算力的需求場(chǎng)景。
例如車路協(xié)同、低速自動(dòng)駕駛(無(wú)人配送車、港口物流園區(qū)無(wú)人駕駛的車輛)等。
而載天VE1之所以能夠“勝任”于這些場(chǎng)景,還是得益于它自身的性能:
在 40~65瓦功耗下,INT8峰值算力達(dá)100TOPS
吞吐率達(dá)到主流GPU的2倍,但延時(shí)不到主流GPU的5%
軟件平臺(tái)VastStream
但也誠(chéng)如剛才所言,硬件性能上的“單打獨(dú)斗”并不能將其功力全程發(fā)揮出來(lái)。
因此,瀚博半導(dǎo)體對(duì)此的破解之道,便是“軟硬一體”——VastStream。
據(jù)了解,VastStream軟件平臺(tái),可以加速各類AI應(yīng)用的部署。
例如計(jì)算機(jī)視覺(jué)、視頻處理、自然語(yǔ)言處理、搜索與推薦、算子自定義擴(kuò)展等。
而其全新軟件組件,還提供了系統(tǒng)管理等三大管理工具,方便客戶部署。
與此同時(shí),VastStream的基礎(chǔ)軟件棧功能也變得更加豐富。
主要特性包括統(tǒng)一接口、靈活調(diào)度、通用AI計(jì)算、多路高效視頻轉(zhuǎn)碼+AI增強(qiáng)、易編程快遷移、工具鏈完備等。
至此,不難看出瀚博半導(dǎo)體已經(jīng)出現(xiàn)一條清晰可見(jiàn)的業(yè)務(wù)線:
芯片、推理加速卡、一體機(jī)的硬件產(chǎn)品,再到軟件整合的系統(tǒng)解決方案。
那么對(duì)于這位新晉的“GPU玩家”來(lái)說(shuō),如今也到了回答這個(gè)問(wèn)題的時(shí)候:
瀚博要走怎樣的一條“GPU之路”?
對(duì)于這個(gè)問(wèn)題,錢軍其實(shí)在現(xiàn)場(chǎng)已經(jīng)給出了答案:
我們致力于做全球*的綜合算力平臺(tái)。
而這次預(yù)覽的GPU,可以說(shuō)僅是瀚博半導(dǎo)體完整拼圖中的重要一塊。
這一點(diǎn),從瀚博半導(dǎo)體的發(fā)展路徑中便可以了解一二。
錢軍在創(chuàng)立瀚博半導(dǎo)體之初,雖然有著數(shù)十年深耕GPU的團(tuán)隊(duì),但他們卻沒(méi)有直接切入到造GPU的賽道。
選擇的切入點(diǎn)反倒是“AI+視頻”,而且這其中的AI更多的是在推理應(yīng)用側(cè)。
之所以如此,是因?yàn)殄X軍認(rèn)為視頻就像一枚硬幣,有著2個(gè)維度。
對(duì)于已經(jīng)產(chǎn)生的視頻,是一個(gè)計(jì)算機(jī)處理的問(wèn)題,包括增強(qiáng)、分析等等。
而對(duì)于還未出現(xiàn)的視頻,那就是一個(gè)像素生產(chǎn)的問(wèn)題,包括渲染等工作。
雖然此前瀚博半導(dǎo)體從未官宣過(guò)類似SG100這樣的GPU的消息,但與GPU相關(guān)的能力其實(shí)已經(jīng)是嵌套在了此前的產(chǎn)品中,只是并未對(duì)外宣傳。
此舉背后的邏輯,就是讓產(chǎn)品先用起來(lái),然后再打造一顆獨(dú)立的高性能GPU。
加之已有的推理卡、軟硬件等,便可把“綜合算力平臺(tái)”的拼圖拼完整了。
然而把“國(guó)產(chǎn)GPU”這條線鋪開(kāi)來(lái)看,在瀚博半導(dǎo)體之前,已然是一副勢(shì)頭兇猛的態(tài)勢(shì)。
那么在這樣的大環(huán)境之下,瀚博半導(dǎo)體正式進(jìn)入“國(guó)產(chǎn)GPU玩家”之列,其所持的殺手锏又將是什么?
對(duì)此,錢軍表示:
重要的不是只有一個(gè)芯片、一個(gè)“硬疙瘩”;更重要的是一個(gè)軟件的生態(tài)和合作的生態(tài)。
唯有做到高性能、低成本,然后用起來(lái)才是硬道理。
One More Thing
瀚博半導(dǎo)體此次正式步入GPU市場(chǎng),一個(gè)非常醒目的標(biāo)簽,便是團(tuán)隊(duì)擁有在AMD數(shù)年的造芯經(jīng)驗(yàn)。
而在2020年成立的摩爾線程,其創(chuàng)始人也曾在GPU巨頭英偉達(dá)任職長(zhǎng)達(dá)15年。
兩個(gè)GPU巨頭之間長(zhǎng)期的“對(duì)壘”,已然是人盡皆知的事情。
但現(xiàn)在,從英偉達(dá)和AMD出走的人,在國(guó)產(chǎn)GPU這條道路上再度“交鋒”。
嗯,有點(diǎn)意思。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。