云天勵(lì)飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充FF發(fā)布第二品牌Faraday X:對(duì)標(biāo)豐田 專注增程式混動(dòng)車型黑神話悟空總收入超67億:銷量已超2000萬份通快成立激光業(yè)務(wù)區(qū)域中心(中國),強(qiáng)勢布局中國市場Sandalwood Advisors受邀參加第31屆中信里昂投資者論壇淘寶倒逼新風(fēng)向:一場電商減負(fù)運(yùn)動(dòng)博浪AI時(shí)代,阿里、華為“硬碰硬”Youtube將推出人工智能工具 可生成創(chuàng)意、標(biāo)題甚至完整視頻申通、圓通、韻達(dá)發(fā)布 8 月簡報(bào):快遞業(yè)務(wù)量、收入均同比增長,單票收入均下降蘋果iPhone 16系列開啟發(fā)售,Max最高加2500元TECNO 全球發(fā)布二代折疊屏旗艦—PHANTOM V Fold2 5G及PHANTOM V Flip2 5G科大訊飛還是AI“小甜甜”嗎?消息稱美團(tuán)外賣調(diào)整經(jīng)營目標(biāo),從追求 GMV 變?yōu)樽非笥唵瘟?/a>消息稱淘寶“大服飾全球包郵計(jì)劃”升級(jí),品類“擴(kuò)容”至全行業(yè)Brightband獲1000萬美元融資,可用AI預(yù)測極端天氣菊樂股份再次申報(bào)IPO:四度闖關(guān)未果,超七成收入來自四川傳AI芯片設(shè)計(jì)公司Ampere尋求出售,或放棄IPO引領(lǐng)通用具身新時(shí)代:普渡發(fā)布首款類人形機(jī)器人PUDU D7辦公軟件的超級(jí)英雄?金山WPS AI會(huì)員人數(shù)破百萬,鴻蒙版全面開跑
  • 首頁 > 數(shù)據(jù)存儲(chǔ)頻道 > 數(shù)據(jù).存儲(chǔ)頻道 > 半導(dǎo)體

    2024年,人工智能芯片展望

    2024年01月02日 10:56:13   來源:微信公眾號(hào):半導(dǎo)體行業(yè)觀察

      2023年,隨著以大語言模型為代表的人工智能市場持續(xù)火爆,我們看到了人工智能成為了半導(dǎo)體行業(yè)的*推動(dòng)力,也見證了Nvidia驚人的銷售業(yè)績以及其市值創(chuàng)下新高。隨著新年的到來,我們也對(duì)2024年人工智能芯片做一個(gè)展望。

      市場需求:人工智能仍將繼續(xù)火熱

      從市場需求側(cè)來看,我們認(rèn)為人工智能在2024年仍然將繼續(xù)火熱,這也將繼續(xù)推動(dòng)相關(guān)的芯片行業(yè)保持良好的態(tài)勢。然而,與2023年不同的是,我們認(rèn)為在2024年,人工智能市場的需求會(huì)同時(shí)從云端慢慢擴(kuò)展到終端,這也將驅(qū)動(dòng)相應(yīng)的芯片市場發(fā)展。

      首先,從云端需求來看,大語言模型仍然將是主要的增長點(diǎn)。同時(shí),圖像生成類模型也會(huì)保持快速增長的勢頭。具體來說,大語言模型仍然是各大科技公司競相研發(fā)的核心技術(shù),包括OpenAI,微軟,谷歌,華為,阿里巴巴,百度等中外科技公司都在大力研發(fā)下一代的大語言模型,而包括中國移動(dòng)等傳統(tǒng)行業(yè)的公司也在入局大語言模型領(lǐng)域,同時(shí)還有大量的初創(chuàng)公司在依靠風(fēng)險(xiǎn)投資的支持也在大力開發(fā)大語言模型。大語言模型的百家爭鳴時(shí)代才剛剛開始并且遠(yuǎn)遠(yuǎn)沒有落下帷幕,在這樣的群雄逐鹿的時(shí)間節(jié)點(diǎn),預(yù)計(jì)對(duì)于芯片的需求也會(huì)快速增長。大語言模型的特點(diǎn)是需要海量的數(shù)據(jù)和訓(xùn)練芯片資源,而且同時(shí)由于格局尚未塵埃落定有大量的公司在研發(fā)新的模型,因此總體來說訓(xùn)練芯片的需求會(huì)非常大。

      而隨著云端人工智能交互進(jìn)入多模態(tài)時(shí)代,聊天機(jī)器人已經(jīng)不僅僅可以用文字回答,而且還可以完成看圖說話以及圖像甚至視頻生成等任務(wù),因此我們認(rèn)為,圖像生成類的模型,以及圖像和語言結(jié)合的多模態(tài)模型也將會(huì)成為云端人工智能的一個(gè)重要增長點(diǎn)。

      除了云端之外,我們認(rèn)為終端(包括手機(jī)和智能車)也將會(huì)成為人工智能的新增長點(diǎn)。手機(jī)上的人工智能雖然早已不再新鮮,但是隨著生成模型的成熟,我們可望看到這類模型落地手機(jī)端并賦能新的用戶體驗(yàn)。手機(jī)端生成類模型又分為兩種,一種是圖像生成類模型,即以擴(kuò)散模型(diffusion model)為代表的模型,這類模型可以實(shí)現(xiàn)高質(zhì)量超分辨以及高質(zhì)量修圖,從而可望給用戶的拍照和照片編輯帶來革命性的變化。另一類應(yīng)用是語言模型——與運(yùn)行在云端的大語言模型(LLM)相對(duì)地,過去幾個(gè)月我們看到了小語言模型(SLM)的興起。小語言模型和大語言模型一樣,都是主要用于語言的理解和生成(或者說,與人對(duì)話);小語言模型在參數(shù)量變少之后,可以更靈活地應(yīng)用在一些專用的場景中(而不是像大語言模型一樣試圖覆蓋所有場景)并且提供很高的準(zhǔn)確性,同時(shí)還有可能運(yùn)行在終端設(shè)備中。

      從智能車領(lǐng)域,一方面隨著端到端多任務(wù)大模型帶來的革命性性能提升(例如BEVFormer帶來的俯瞰場景識(shí)別性能提升,以及商湯在2023發(fā)布的UniAD帶來的多任務(wù)性能大幅提升)會(huì)推動(dòng)這類模型進(jìn)一步落地并且推動(dòng)芯片的需求,另一方面則是來自于語言模型人機(jī)交互這類源自于云端的人工智能應(yīng)用遷移到智能車場景。

      因此,我們預(yù)測,2024年將會(huì)是人工智能持續(xù)火熱的一年,與2023年不同的是除了云端人工智能保持熱門之外,我們預(yù)計(jì)終端應(yīng)用場景也會(huì)成為新的人工智能需求增長點(diǎn)。

      云端市場格局分析

      云端人工智能芯片市場,我們預(yù)計(jì)Nvidia仍然將保持領(lǐng)跑地位,但是AMD等競爭者預(yù)計(jì)也將獲得更多市場份額。

      首先,如前所述,云端市場目前主要的需求在于大語言模型和生成式圖像的訓(xùn)練和推理。由于這些模型對(duì)于計(jì)算資源需求非常大,而且訓(xùn)練任務(wù)占的比例很大,因此給相應(yīng)的芯片設(shè)了一個(gè)很高的門檻。這里的門檻包括了:

      - 芯片算力:為了支持巨大的計(jì)算量,芯片需要有足夠的計(jì)算單元,內(nèi)存容量和帶寬

      - 分布式計(jì)算支持:對(duì)于大模型來說分布式計(jì)算是必須的

      - 軟件兼容性和生態(tài):對(duì)于訓(xùn)練來說,對(duì)于模型進(jìn)行反復(fù)快速迭代是一個(gè)很強(qiáng)的需求,因此必須有足夠好的生態(tài)來支持不同的模型算符快速迭代

      目前而言,Nvidia在這一個(gè)領(lǐng)域仍然是*,無論是其芯片和分布式計(jì)算性能,還是軟件生態(tài)兼容性來說,都是*。這也是為什么2023年Nvidia的H100成為了人工智能相關(guān)公司最寶貴的資源,在市場上供不應(yīng)求。在2024 H2,Nvidia將會(huì)開始出貨H200,相對(duì)于H100來說,H200擁有40%和內(nèi)存帶寬提升以及80%的內(nèi)存容量提升,因此可望會(huì)被人工智能公司爭相購買。

      在2024年,我們預(yù)計(jì)AMD在云端人工智能領(lǐng)域也將更加站穩(wěn)腳跟,并由此開始慢慢走向更大的市場份額。2023下半年,AMD發(fā)布了最新的MI300X用于高性能計(jì)算的GPU模組,該芯片包含大芯片粒(12個(gè)處理器/IO芯片粒),并且相比于H200來說,擁有更高(1.6倍)的FP8算力,以及更大的內(nèi)存容量和帶寬(1.2倍)。從AMD公布的實(shí)測數(shù)據(jù)來看,MI300X的推理能力大約比H100強(qiáng)20%-40%,訓(xùn)練性能則和H100持平。我們認(rèn)為,軟件生態(tài)(包括編譯器性能)將成為決定AMD在云端人工智能市場能否成功的決定性因素,而這一點(diǎn)預(yù)計(jì)在2024年將會(huì)有所改善:OpenAI將在最新發(fā)布的Triton框架中加入對(duì)于AMD MI300X的支持,而各大初創(chuàng)公司的人工智能加速軟件框架也在加強(qiáng)對(duì)于AMD GPU的支持。隨著芯片性能和軟件生態(tài)的提升,以及各大科技公司對(duì)于Nvidia GPU一家獨(dú)大地位的擔(dān)憂態(tài)度,我們預(yù)計(jì)2024年對(duì)于AMD的GPU在人工智能市場將會(huì)是重要的一年,預(yù)計(jì)將會(huì)看到更多客戶的應(yīng)用。

      從供應(yīng)鏈角度,由于云端人工智能芯片對(duì)于HBM3等高帶寬內(nèi)存有著強(qiáng)力的需求,我們認(rèn)為HBM內(nèi)存以及高級(jí)封裝(如CoWoS)的產(chǎn)能仍然將會(huì)火熱,這也將推動(dòng)相應(yīng)半導(dǎo)體企業(yè)擴(kuò)大產(chǎn)能,以及積極研發(fā)下一代內(nèi)存和高級(jí)封裝技術(shù)。從這個(gè)角度看,人工智能應(yīng)用仍然將會(huì)是推動(dòng)半導(dǎo)體新技術(shù)高速發(fā)展的核心動(dòng)力。

      終端市場格局分析

      除了云端市場外,我們預(yù)計(jì)人工智能對(duì)于終端市場也有更強(qiáng)的需求,這也將推動(dòng)人工智能成為終端計(jì)算芯片中越來越重要的差異化元素。

      在手機(jī)端,人工智能的使用頻率將會(huì)進(jìn)一步增強(qiáng),這也會(huì)推動(dòng)芯片加入更多相應(yīng)的算力,并且將人工智能支持作為SoC的核心亮點(diǎn)。例如高通發(fā)布的Snapdragon 8 Gen 3就以“低于一秒的延遲實(shí)現(xiàn)圖像生成任務(wù)”作為一個(gè)重要賣點(diǎn),估計(jì)這樣的人工智能能力將會(huì)深度集成到手機(jī)廠商的操作系統(tǒng)中。除了高通這樣的第三方芯片公司之外,自研手機(jī)芯片的系統(tǒng)廠商預(yù)計(jì)也會(huì)繼續(xù)加碼人工智能;蘋果雖然在這方面保持低調(diào),但是預(yù)計(jì)在未來會(huì)以各種方式(加大NPU算力,或者是加大軟件支持)的方法來開始賦能更多人工智能在iPhone上的新拍攝用戶體驗(yàn)。vivo在自研ISP芯片領(lǐng)域已經(jīng)有了數(shù)年積累,而目前生成式人工智能對(duì)于拍攝體驗(yàn)的提升恰好和ISP有很強(qiáng)的協(xié)同作用,這也是2023年8月vivo發(fā)布的v3 ISP芯片強(qiáng)調(diào)了生成式人工智能作為一個(gè)核心亮點(diǎn)。未來,預(yù)計(jì)會(huì)看到越來越多這樣的芯片強(qiáng)調(diào)人工智能對(duì)于用戶體驗(yàn)上的賦能作用。

      在智能汽車領(lǐng)域,Nvidia雖然不如在云端強(qiáng)勢,但是其Orin系列芯片仍然是各大車廠考慮的標(biāo)準(zhǔn)芯片模組。我們認(rèn)為,隨著人工智能大模型對(duì)于智能駕駛的賦能作用逐漸加強(qiáng),無論是第三方芯片還是車廠自研的芯片都將會(huì)進(jìn)一步強(qiáng)化對(duì)于人工智能算力的投入,同時(shí)也推動(dòng)芯片性能的快速提升——最近,無論是蔚來發(fā)布新自研芯片的算力規(guī)格,還是特斯拉傳出將使用TSMC 3nm作為下一代芯片的生產(chǎn)工藝,都在提示著我們2024年人工智能將在智能車芯片領(lǐng)域扮演越來越重要的角色。

      哪些新技術(shù)值得關(guān)注?

      除了以上討論的芯片之外,有哪些新技術(shù)可望會(huì)為人工智能芯片領(lǐng)域帶來新的變化?

      首先,存內(nèi)計(jì)算和近內(nèi)存計(jì)算/處理技術(shù)可望會(huì)得到越來越多的關(guān)注。對(duì)于云端人工智能來說,內(nèi)存訪問開銷一直是一個(gè)性能瓶頸,而隨著大模型的參數(shù)量越來越大,內(nèi)存訪問帶來的開銷也越來越大。存內(nèi)計(jì)算和近內(nèi)存計(jì)算/處理技術(shù)的主要目的就是為了降低這樣的開銷,讓一些計(jì)算和處理任務(wù)能夠在內(nèi)存中就完成。在這個(gè)領(lǐng)域,三星的PIM(process in memory)和PNM(process near memory)技術(shù)非常值得我們關(guān)注,而這些技術(shù)也可望會(huì)成為三星未來進(jìn)一步提高自身存儲(chǔ)器技術(shù)差異化競爭力的關(guān)鍵。

      對(duì)于終端人工智能來說,智能汽車場景中由于對(duì)于延遲有著較強(qiáng)的需求,因此新技術(shù)有比較多的機(jī)會(huì)能產(chǎn)生影響。在云端,以GPU為代表的加速芯片都是主要基于優(yōu)化吞吐量的考慮,而不是延遲,因此在智能車領(lǐng)域必須有新的架構(gòu)設(shè)計(jì)。對(duì)于車載應(yīng)用來說,數(shù)據(jù)都是以數(shù)據(jù)流的形式(而不是批量的形式)進(jìn)入處理器,因此人工智能芯片必須能高速低延遲處理這些數(shù)據(jù)流。另一方面,大模型正在進(jìn)入智能車應(yīng)用,因此如何在低延遲的情況下支持大模型推理,將會(huì)是智能車芯片中新技術(shù)需要重點(diǎn)突破的方向。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。