人工智能的“過彎點”，三駕馬車已經(jīng)全面調(diào)整了姿態(tài)

2024年08月02日 20:18:45 陳泊丞 來源：智能相對論

　　文 | 智能相對論

　　作者 | 陳泊丞

　　日前，英偉達CEO黃仁勛和Meta創(chuàng)始人馬克・扎克伯格開展了一場“爐邊談話”。

　　兩人作為當今人工智能領(lǐng)域的領(lǐng)袖人物，一邊憑借AI芯片的絕對優(yōu)勢占據(jù)著算力領(lǐng)域的至高地位，另一邊借助開源大模型Llama 3.1強勢崛起成為開源領(lǐng)域的標桿。這樣的對話為未來AI的發(fā)展趨勢呈現(xiàn)了不同的視角。

　　兩位大咖的對話為我們描繪了AI技術(shù)未來的發(fā)展藍圖：從開源的AI算法，到先進的人形機器人，到未來即將普及的智能眼鏡，AI技術(shù)發(fā)展充滿了機遇與挑戰(zhàn)。未來AI手機、AIPC、AI汽車、智能眼鏡、服務(wù)器等等各類產(chǎn)品都會實現(xiàn)智能化升級，復(fù)雜的模型、海量的數(shù)據(jù)和計算，都極大地依賴于AI算力支持。

　　AI算力也正在從專用計算擴展到所有的計算場景，逐步形成“一切計算皆AI”的格局。

　　事實上，算力廠商們的動作也見證了市場對算力發(fā)展的要求。一方面，CPU、GPU、NPU等各種PU，也都被用于了AI計算。

　　另一方面，在適配不同場景應(yīng)用的通用服務(wù)器上，浪潮信息也在致力于提供兼具高性能與低成本的選擇。前不久，基于2U4路旗艦通用服務(wù)器NF8260G7，浪潮信息創(chuàng)新采用領(lǐng)先的張量并行、NF4模型量化等技術(shù)，實現(xiàn)了服務(wù)器僅依靠4顆CPU即可運行千億參數(shù)“源2.0”大模型，再度成為通用AI算力的新標桿。

　　在今天的市場上，算力的產(chǎn)業(yè)地位正在迅速崛起。對應(yīng)人工智能發(fā)展的三駕馬車，算力、算法、數(shù)據(jù)三者終于到達了一個地位相當?shù)臓顟B(tài)，走向“并駕齊驅(qū)”。

　　要知道，在AI技術(shù)發(fā)展的前期，中國龐大的互聯(lián)網(wǎng)用戶群體和豐富的在線數(shù)據(jù)資源，側(cè)重于數(shù)據(jù)的發(fā)展。而美國在計算機科學(xué)、數(shù)學(xué)和統(tǒng)計學(xué)等基礎(chǔ)學(xué)科方面有著悠久的研究傳統(tǒng)，則更聚焦算法的研發(fā)。對比兩者，算力在前期的關(guān)注度就顯得弱了許多。

　　時至今日，三駕馬車并駕齊驅(qū)。大眾對人工智能的發(fā)展思路也愈發(fā)清晰——AI產(chǎn)業(yè)的爆發(fā)是算法、算力與數(shù)據(jù)三者協(xié)同發(fā)展的結(jié)果。而這樣的狀態(tài)也就代表著AI產(chǎn)業(yè)正在進入一個全新的階段。

　　人工智能產(chǎn)業(yè)來到了“過彎點”

　　現(xiàn)階段，大模型技術(shù)的加速迭代，帶來了千億級大模型的持續(xù)涌現(xiàn)與精進。相關(guān)的AI應(yīng)用也在以前所未有的速度和規(guī)模滲透到各行各業(yè)，并融入日常的生活和工作中。

　　人工智能產(chǎn)業(yè)正在從初步探索進入到了廣泛應(yīng)用的“過彎點”。在這個過程中，AI的三駕馬車也到了全面協(xié)同發(fā)展的關(guān)鍵時刻，才能為場景應(yīng)用的跨越式升級提供必要的技術(shù)支持。

　　以銀行的防欺詐系統(tǒng)為例，早期的系統(tǒng)是基于大數(shù)據(jù)構(gòu)建的，通過經(jīng)驗預(yù)設(shè)規(guī)則和統(tǒng)計模型來判斷、檢測可疑交易。如今，基于更高性能的通用算力整合大數(shù)據(jù)系統(tǒng)和金融防詐的AI模型，銀行防欺詐系統(tǒng)實現(xiàn)了功能升級，不僅具備更高的準確性和更低的誤報率，而且還能夠根據(jù)新的數(shù)據(jù)自我學(xué)習(xí)和調(diào)整，快速適應(yīng)新的欺詐模式。

　　算法、算力和數(shù)據(jù)三者協(xié)同，構(gòu)成當前AI應(yīng)用的基本范式。一個成功的AI項目往往需要在這三個方面都做出適當?shù)耐度牒蛢?yōu)化。

　　算法相當于AI的大腦，負責(zé)處理信息、學(xué)習(xí)知識、做出決策。而數(shù)據(jù)是算法的基礎(chǔ)，如果沒有足夠的數(shù)據(jù)，即使是再先進的算法也無法發(fā)揮出應(yīng)有的效果。

　　而在此基礎(chǔ)上，不管是算法的運行還是數(shù)據(jù)的處理，都離不開算力的支持。特別是在涉及到大量的數(shù)據(jù)處理、復(fù)雜的模型訓(xùn)練以及實時的推理需求等場景中，AI對算力的要求，同時隨著場景的規(guī)�；占�，還得進一步兼顧經(jīng)濟性。

　　現(xiàn)如今，針對AI產(chǎn)業(yè)的三駕馬車，算法、算力和數(shù)據(jù)層面的升級依舊在同步進行，三者之間的協(xié)同在AI行業(yè)發(fā)展的驅(qū)動下達到了新高度。AI產(chǎn)業(yè)的加速發(fā)展，需要三駕馬車的步伐更加一致。

　　是時候全面調(diào)整三駕馬車的狀態(tài)了

　　人工智能的廣泛應(yīng)用必然要建立在三駕馬車協(xié)同發(fā)展的基礎(chǔ)上。在接下來的時間內(nèi)，針對人工智能產(chǎn)業(yè)的升級就需要解決一個關(guān)鍵問題，即如何保持三駕馬車并駕齊驅(qū)的穩(wěn)定狀態(tài)。

　　一、技術(shù)“并駕”：一馬當先并非最佳，三馬同行最為穩(wěn)定。

　　算力、算法、數(shù)據(jù)三者相輔相成，單一的技術(shù)領(lǐng)先無法帶來AI產(chǎn)業(yè)的全面爆發(fā)，必須要另外兩項迅速補齊，才能對應(yīng)解決相關(guān)的技術(shù)問題。

　　例如，在當前，千億級參數(shù)、甚至萬億級參數(shù)的大模型加速發(fā)展，帶來了更強大的信息處理和決策能力，為智能涌現(xiàn)提供了基礎(chǔ)。但是，算法層面的突破，必然要有算力、數(shù)據(jù)層面的升級，才能發(fā)揮出應(yīng)用的效果。簡單來說，如果沒有足夠的算力帶動千億級大模型的訓(xùn)練、推理等需求，那么再強大的模型也沒有“用武之地”。

　　要加速人工智能的發(fā)展，支撐千行百業(yè)最廣泛的通用場景，千億級大模型必須要和大數(shù)據(jù)、數(shù)據(jù)庫、云等場景相融合，實現(xiàn)高效運行。

　　但這一目標對計算、內(nèi)存、通信等硬件資源需求量非常大。為了滿足更多用戶的AI算力需求，算力廠商不得不考慮如何有針對性地去克服現(xiàn)有的算力瓶頸。以承載千億參數(shù)大模型推理的NF8260G7 AI通用服務(wù)器來看，浪潮信息在這方面就做出了專業(yè)的設(shè)計。

　　針對千億級大模型推理過程中的低時延以及所需的巨大內(nèi)存需求，NF8260G7服務(wù)器配置了4顆具有AMX的AI加速功能的英特爾至強處理器，內(nèi)存方面，NF8260G7配置32根32G DDR5 4800MHZ的內(nèi)存，內(nèi)存帶寬實測值分別為995GB/s(讀帶寬)、423GB/s(寫帶寬)、437GB/s(讀寫帶寬)，為滿足千億大模型低延時和多處理器的并發(fā)推理計算打下基礎(chǔ)。同時，浪潮信息還對CPU之間、CPU與內(nèi)存之間的高速互聯(lián)信號走線路徑和阻抗連續(xù)性做了優(yōu)化，從而更好地支撐大規(guī)模并發(fā)計算。

　　這樣的設(shè)計與升級，旨在面向算法，進行算力的優(yōu)化，為接下來千億級大模型的規(guī)�；瘧�(yīng)用提供了一個非常關(guān)鍵的支撐。

　　二、系統(tǒng)“齊驅(qū)”：三馬拉車，重在系統(tǒng)性優(yōu)化。

　　隨著AI技術(shù)的發(fā)展，算力、算法、數(shù)據(jù)三者的系統(tǒng)性越來越強。很多科技巨頭都在競相發(fā)力尋找「模型水平高、算力門檻低」的人工智能方案。AI相關(guān)的解決方案不再是單一技術(shù)的應(yīng)用，而是綜合多個領(lǐng)域的突破實現(xiàn)整體系統(tǒng)性的升級。

　　舉個例子，谷歌的EfficientNet模型通過優(yōu)化網(wǎng)絡(luò)架構(gòu)，在ImageNet數(shù)據(jù)集上的精度相比傳統(tǒng)模型提升了約6%，而所需計算量減少了70%�？梢�，當前大模型廠商在推動算力升級的過程中，也會考慮到軟件層面的創(chuàng)新，提高算力和算法之間的適配運行能力。

　　為了能讓通用服務(wù)器更好的運行千億級大模型，浪潮信息除了對服務(wù)器本身進行創(chuàng)新升級外，也對千億級大模型的參數(shù)規(guī)模做了優(yōu)化。基于源2.0的算法研發(fā)積累，浪潮信息將1026億參數(shù)的源2.0大模型卷積算子進行張量切分，為通用服務(wù)器進行高效的張量并行計算提供了可能，最終提高了推理計算效率。

　　同時，在這個過程中，浪潮信息還采用了NF4量化技術(shù)，對模型進行“瘦身”，提高了推理的解碼效率等等。

　　當算力、算法走向協(xié)同，系統(tǒng)性優(yōu)化的結(jié)果，是建立在兩者協(xié)同的基礎(chǔ)之上，最終目的在于為AI產(chǎn)業(yè)的落地提供一個穩(wěn)定、強大的技術(shù)底座。未來，AI產(chǎn)業(yè)的全面爆發(fā)就需要以更系統(tǒng)的理念去驅(qū)動三駕馬車的發(fā)展。

　　三、應(yīng)用“加速”：產(chǎn)業(yè)落地需要“三駕馬車”的綜合最優(yōu)解。

　　AI不再是實驗室的產(chǎn)物，而是市場競爭的商品。不管是千億級大模型的涌現(xiàn)，或是算力解決方案的升級，其根本的目標都是推動AI應(yīng)用的加速落地，走向大眾，帶來實際性的經(jīng)濟效益。因此，在技術(shù)層面之外，行業(yè)還需要考慮經(jīng)濟層面的問題。

　　對比來看，盡管以英偉達GPU芯片為核心的AI服務(wù)器在處理機器學(xué)習(xí)、深度學(xué)習(xí)等高性能計算任務(wù)方面表現(xiàn)卓越，但是浪潮信息等算力廠商依舊致力于研發(fā)和升級以CPU為核心的通用服務(wù)器，這是為什么?

　　根本原因就在于CPU在通用計算、能效比以及成本效益方面仍然不可替代。特別是關(guān)系成本效益的經(jīng)濟性問題，本來就是當前限制諸多場景應(yīng)用規(guī)模化落地發(fā)展的關(guān)鍵因素。因為AI專用基礎(chǔ)設(shè)施的成本居高不下，普通的企業(yè)很難承受。而浪潮信息則是提供了一個更低成本、同時兼顧高性能的經(jīng)濟性選擇，恰恰正是市場需要的。

　　基于通用服務(wù)器NF8260G7的軟硬件協(xié)同創(chuàng)新，浪潮信息成功實現(xiàn)了千億級大模型在通用服務(wù)器的推理部署，同時還提供了性能更強，成本更經(jīng)濟的選擇，讓AI大模型應(yīng)用可以與云、大數(shù)據(jù)、數(shù)據(jù)庫等應(yīng)用能夠?qū)崿F(xiàn)更緊密的融合，助力產(chǎn)業(yè)高質(zhì)量發(fā)展。這樣的綜合最優(yōu)解，才是產(chǎn)業(yè)實現(xiàn)規(guī)�；l(fā)最需要的條件。

　　結(jié)語

　　AI三駕馬車的系統(tǒng)性已經(jīng)成型，更強大的算力可以支持更復(fù)雜的算法模型，從而更好地處理大規(guī)模數(shù)據(jù)。同時，高質(zhì)量的數(shù)據(jù)集有助于提升算法的效果，反過來又需要更強大的算力來處理。而算法的進步也可以減少對算力的需求，通過更高效的模型設(shè)計降低計算成本。

　　這種系統(tǒng)性的形成，將極大推動人工智能產(chǎn)業(yè)的發(fā)展，也為現(xiàn)階段AI廠商們的產(chǎn)品升級、技術(shù)迭代、服務(wù)進階提供了一個關(guān)鍵的大方向。但同時，也意味著新的挑戰(zhàn)，即如何去整合算力、算法和數(shù)據(jù)三者之間的技術(shù)與資源，成就新的突破。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信