全球AI行業(yè)計(jì)算技術(shù)盛會(huì)如期而至。當(dāng)?shù)貢r(shí)間周二,在英偉達(dá)2023年春季GTC大會(huì)上,該公司CEO黃仁勛穿著標(biāo)志性皮夾克,向開發(fā)者披露最新的硬件和AI應(yīng)用軟件進(jìn)展。
簡(jiǎn)而言之,本次演講具有其“亮點(diǎn)”、“重點(diǎn)”和多個(gè)“看點(diǎn)”。其中“亮點(diǎn)”是英偉達(dá)秘密研發(fā)并向芯片制造業(yè)甩出的一枚技術(shù)“核彈”——光刻計(jì)算庫(kù)cuLitho,可以用500套DGX H100,取代4萬(wàn)個(gè)用來(lái)驅(qū)動(dòng)計(jì)算光刻的CPU服務(wù)器。“重點(diǎn)”是圍繞生成式AI發(fā)布的系列加速模型訓(xùn)練和推理軟硬件產(chǎn)品及服務(wù),而“看點(diǎn)”則是展示針對(duì)量子計(jì)算、云服務(wù)、元宇宙、汽車等領(lǐng)域的新進(jìn)展。
值得注意,為了出口至中國(guó)市場(chǎng),英偉達(dá)基于旗艦芯片H100開發(fā)出了H800芯片,并稱800系列產(chǎn)品完全符合出口管制法規(guī),而且已被多家國(guó)內(nèi)科技企業(yè)采用。但業(yè)內(nèi)人士指出,H800的數(shù)據(jù)傳輸速率已被降低到旗艦H100速率的一半左右。
計(jì)算光刻提速40倍 獲半導(dǎo)體巨頭力挺
在黃仁勛本次主題演講中,最大的亮點(diǎn)莫過(guò)于英偉達(dá)秘密研發(fā)四年、向業(yè)界甩出的一枚技術(shù)“核彈”——通過(guò)突破性的光刻計(jì)算庫(kù)cuLitho,將計(jì)算光刻加速40倍以上?梢哉f(shuō),計(jì)算光刻是提高光刻分辨率、推動(dòng)芯片制造達(dá)到尖端工藝的關(guān)鍵手段。
據(jù)了解,作為芯片制造過(guò)程中最復(fù)雜、昂貴、關(guān)鍵的環(huán)節(jié)之一,光刻成本約占硅片加工成本的1/3以上。配合光刻計(jì)算EDA工具使用,其可以幫助晶圓廠縮短原型周期時(shí)間、提高產(chǎn)量,為2nm及以上先進(jìn)工藝奠定基礎(chǔ),并使得曲線掩模、High NA EUV、亞原子級(jí)光刻膠模型等新技術(shù)節(jié)點(diǎn)所需的新型解決方案和創(chuàng)新技術(shù)成為可能。
“計(jì)算光刻是芯片設(shè)計(jì)和制造領(lǐng)域中最大的計(jì)算工作負(fù)載,每年消耗數(shù)百億CPU小時(shí)。”黃仁勛稱,“大型數(shù)據(jù)中心24x7全天候運(yùn)行,以便創(chuàng)建用于光刻系統(tǒng)的掩膜板。這些數(shù)據(jù)中心是芯片制造商每年投資近2000億美元資本支出的一部分。”
另?yè)?jù)其介紹,英偉達(dá)H100 GPU需要89塊掩膜板,在CPU上運(yùn)行時(shí)處理單個(gè)掩膜板需要兩周時(shí)間,而在GPU上運(yùn)行cuLitho只需8小時(shí)。通過(guò)這項(xiàng)應(yīng)用,臺(tái)積電可以把4萬(wàn)個(gè)用來(lái)驅(qū)動(dòng)計(jì)算光刻的CPU服務(wù)器,換成500套DGX H100,能耗將從35兆瓦降至5兆瓦。此外,使用cuLitho的晶圓廠,每天可以生產(chǎn)3-5倍多的光掩膜,僅使用當(dāng)前配置電力的1/9。
實(shí)際上,在計(jì)算光刻庫(kù)研發(fā)過(guò)程中,英偉達(dá)已經(jīng)與三家全球頂頂尖芯片廠商開展了長(zhǎng)達(dá)4年的合作,包括晶圓制造巨頭臺(tái)積電、光刻機(jī)制造商ASML,以及EDA巨頭新思科技。目前,這三家廠商均已開始將cuLitho技術(shù)引入芯片設(shè)計(jì)和制造流程。
對(duì)于這一“四年磨一劍”的技術(shù),臺(tái)積電CEO魏哲家表示,cuLitho為臺(tái)積電在芯片制造中廣泛地部署光刻解決方案開辟了新的可能性;阿斯麥CEO彼得·溫寧克(Peter Wennink)稱ASML計(jì)劃將對(duì)GPU的支持集成到其所有的計(jì)算光刻軟件產(chǎn)品中;新思科技則表示,在cuLitho平臺(tái)上運(yùn)行公司的光學(xué)鄰近校正(OPC)軟件將性能從幾周加速到幾天。
發(fā)布ChatGPT專用GPU可提速達(dá)10倍
本次GTC開發(fā)者大會(huì)上另一大重點(diǎn),無(wú)疑是當(dāng)前大熱的生成式AI。在演講中,英偉達(dá)發(fā)布了一系列相關(guān)加速模型訓(xùn)練和推理的軟硬件新品及服務(wù)。訓(xùn)練方面,英偉達(dá)H100 GPU基于Hopper架構(gòu)及其內(nèi)置Transformer Engine,針對(duì)生成式AI、大型語(yǔ)言模型和推薦系統(tǒng)的開發(fā)、訓(xùn)練和部署進(jìn)行了優(yōu)化。
在DGX AI基建領(lǐng)域,自從英偉達(dá)向OpenAI交付首臺(tái)DGX超級(jí)計(jì)算機(jī)后,目前《財(cái)富》100強(qiáng)企業(yè)中已經(jīng)有一半用上這類產(chǎn)品。黃仁勛表示,“DGX(AI超級(jí)計(jì)算機(jī))是大型語(yǔ)言模型實(shí)現(xiàn)突破背后的引擎,已成為AI領(lǐng)域的必備工具。”目前,NVIDIA DGX H100 AI超級(jí)計(jì)算機(jī)已全面投入生產(chǎn),很快將面向全球企業(yè)。
值得注意,英偉達(dá)已基于H100芯片開發(fā)了H800版本出口到中國(guó)。英偉達(dá)發(fā)言人表示,“我們的800 系列產(chǎn)品完全符合出口管制法規(guī)”,阿里巴巴、百度和騰訊控股等中國(guó)科技公司的云計(jì)算部門正在使用這款新芯片。對(duì)于兩款芯片的不同之處,據(jù)業(yè)內(nèi)人士透露,H800主要將芯片到芯片的數(shù)據(jù)傳輸速率降低到H100速率的一半左右。
在推理硬件方面,英偉達(dá)也推出了全新GPU推理平臺(tái),包括針對(duì)不同工作負(fù)載進(jìn)行優(yōu)化的4種配置,分別用于AI視頻、圖像生成、大型語(yǔ)言模型(LLM)部署以及推薦系統(tǒng),即L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超級(jí)芯片。
其中,H100 NVL是專門為L(zhǎng)LM設(shè)計(jì)的GPU,采用Transformer加速解決方案,可用于ChatGPT等大型語(yǔ)言模型的大規(guī)模部署。黃仁勛稱,目前在云上唯一可以實(shí)際處理ChatGPT的GPU是HGX A100。與適用于GPT-3處理的HGX A100相比,一臺(tái)搭載4對(duì)H100及雙GPU NVLink的標(biāo)準(zhǔn)服務(wù)器的速度要快10倍。
此外,L4是針對(duì)AI生成視頻的通用GPU,用于加速AI視頻,可以提供比CPU高120倍的性能,能效提升約99%;可以優(yōu)化視頻解碼與轉(zhuǎn)碼、視頻內(nèi)容審核、視頻通話等性能。因此,一臺(tái)8-GPU L4服務(wù)器將取代100多臺(tái)用于處理AI視頻的雙插槽CPU服務(wù)器。
L40則用于圖像生成,針對(duì)2D、3D圖像生成進(jìn)行優(yōu)化,并可以結(jié)合Omniverse直接生成3D內(nèi)容、元宇宙等,推理性能是英偉達(dá)最受歡迎的云推理GPU T4的10倍。而Grace Hopper超級(jí)芯片是為推薦系統(tǒng)和大型語(yǔ)言模型AI數(shù)據(jù)庫(kù)設(shè)計(jì),可以通過(guò)900GB/s的高速一致性芯片到芯片接口連接英偉達(dá)Grace CPU和Hopper GPU。
BlueField-3 DPU已投產(chǎn) 加碼量子計(jì)算布局
除了計(jì)算光刻和生成式AI,英偉達(dá)GTC大會(huì)上也公布了該公司多款最新升級(jí)的技術(shù)產(chǎn)品及服務(wù)。在DPU方面,黃仁勛宣布英偉達(dá)BlueField-3 DPU已投入生產(chǎn),并被騰訊、百度、京東、微軟和甲骨文等多家領(lǐng)先的云服務(wù)提供商所采用,以加速其云計(jì)算平臺(tái)。而在算力生態(tài)以中,英偉達(dá)還想要通過(guò)云服務(wù),把制造大模型的能力交給更多用戶。
在大會(huì)上,英偉達(dá)發(fā)布的DGX Cloud云服務(wù),提供了專用的NVIDIA DGX AI超級(jí)計(jì)算集群。搭配NVIDIA AI軟件,其可使每個(gè)企業(yè)都可以使用簡(jiǎn)單的網(wǎng)絡(luò)瀏覽器訪問(wèn)AI超算,消除了獲取、部署和管理本地基礎(chǔ)設(shè)施的復(fù)雜性,進(jìn)而為生成式AI和其他開創(chuàng)性應(yīng)用訓(xùn)練先進(jìn)的模型。
緊接著,黃仁勛帶來(lái)的另一項(xiàng)關(guān)于云的重磅發(fā)布是NVIDIA AI Foundations,包括語(yǔ)言模型NEMO、視覺模型PICASSO和生物學(xué)模型BIONEMO,以為用戶提供定制化LLM和生成式AI解決方案。其中,NEMO可提供80億、430億、5300億參數(shù)模型;PICASSO可用于訓(xùn)練圖像、視頻和3D應(yīng)用等生成式AI模型;PICASSO可以通過(guò)高文本提示和元數(shù)據(jù)用DGX Cloud上的模型創(chuàng)造AI模型。
值得注意,英偉達(dá)還在量子計(jì)算等前沿科技領(lǐng)域取得了突破。在演講中,黃仁勛宣布的第一個(gè)全新產(chǎn)品就是與Quantum Machines合作的NVIDIA DGX Quantum。該產(chǎn)品結(jié)合了通用量子控制系統(tǒng)Quantum Machines OPX+和NVIDIA Grace Hopper超級(jí)芯片,可為高性能和低延遲量子經(jīng)典計(jì)算的研究人員提供革命性的新架構(gòu)。
據(jù)他介紹,“NVIDIA DGX Quantum是全球首個(gè)GPU加速的量子計(jì)算系統(tǒng),可以實(shí)現(xiàn)GPU和量子處理單元(QPU)之間的亞微秒級(jí)延遲。”這種組合使研究人員能夠建立強(qiáng)大的應(yīng)用,實(shí)現(xiàn)校準(zhǔn)、控制、量子糾錯(cuò)和混合算法,將量子計(jì)算與最先進(jìn)的經(jīng)典計(jì)算相結(jié)合。
另外,英偉達(dá)也發(fā)布了一系列面向元宇宙、汽車和工業(yè)等領(lǐng)域的新進(jìn)展,包括推出第三代OVX計(jì)算系統(tǒng)和新一代工作站,PaaS服務(wù)NVIDIA Omniverse Cloud現(xiàn)已向特定企業(yè)開放,與寶馬集團(tuán)擴(kuò)大合作建設(shè)虛擬工廠、比亞迪更多車型將采用NVIDIA DRIVE Orin平臺(tái)等。在GTC發(fā)布會(huì)上,最后登場(chǎng)的是“數(shù)字孿生”工業(yè)模擬應(yīng)用Omniverse,主要的用處是讓企業(yè)在實(shí)際建設(shè)工廠、生產(chǎn)產(chǎn)品前,通過(guò)數(shù)字化模擬“預(yù)覽”實(shí)際的成品。
結(jié)語(yǔ)
“生成式AI正在推動(dòng)AI的快速應(yīng)用,并將重塑幾乎所有行業(yè)。”黃仁勛數(shù)次表示,如今整個(gè)AI產(chǎn)業(yè)正處于“iPhone時(shí)刻”——創(chuàng)業(yè)公司正在競(jìng)相建立顛覆式的商業(yè)模型,而業(yè)界巨頭也在尋找應(yīng)對(duì)之道。由此,AIGC已在全球商業(yè)界掀起了開發(fā)AI策略的緊迫性。
可以看出,圍繞AI、計(jì)算光刻、量子計(jì)算、芯片等前沿科技發(fā)布一系列前沿技術(shù)和產(chǎn)品,英偉達(dá)已構(gòu)建了一套圍繞產(chǎn)業(yè)上下游運(yùn)轉(zhuǎn)的應(yīng)用開發(fā)生態(tài),覆蓋從GPU、DPU等硬件到幫助企業(yè)加速構(gòu)建定制生成式AI模型的云服務(wù)以及升級(jí)數(shù)據(jù)中心、芯片制造工藝等等,因而在自然科學(xué)、視覺解析、數(shù)據(jù)處理、機(jī)器學(xué)習(xí)和AI等領(lǐng)域成為不可或缺的一環(huán)。
顯而易見,黃仁勛正在帶領(lǐng)英偉達(dá)走向一個(gè)新階段,乃至進(jìn)一步推動(dòng)產(chǎn)業(yè)界釋放新的創(chuàng)造力。近十年來(lái),人工智能的飛速發(fā)展背后其實(shí)都離不開英偉達(dá)的軟硬件支持。而如今,在生成式AI幾乎激勵(lì)著每個(gè)行業(yè)重新設(shè)想其商業(yè)戰(zhàn)略和技術(shù)路線的發(fā)展前景下,英偉達(dá)正在讓行業(yè)伙伴受益AI等前沿應(yīng)用的變革性力量過(guò)程中變得越發(fā)強(qiáng)大,甚至不可替代。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。