人工智能的算力設(shè)計起點已經(jīng)到了萬卡級別,僅靠芯片提升還不夠,要從系統(tǒng)創(chuàng)新入手。
文|趙艷秋
編|牛慧
從去年底到今年初,大模型在企業(yè)中的落地呈現(xiàn)加速之勢。業(yè)界主要生態(tài)牽頭方,都在加快戰(zhàn)略布局。這些布局都涉及國內(nèi)大模型到底應該走上怎樣一條發(fā)展路徑,也影響著每一個生態(tài)的參與者,因而引發(fā)關(guān)注和討論。
相比國外,中國大模型產(chǎn)業(yè)還有一個鮮明特征——百芯百模、算力更多元、模型更多。如何在這樣的現(xiàn)實情況下,實現(xiàn)大模型在企業(yè)的順利落地、規(guī);l(fā)展,業(yè)界也面臨諸多挑戰(zhàn)。
4月17日,大模型生態(tài)鏈上重要的牽頭方之一浪潮信息,在其第十屆生態(tài)伙伴大會(IPF2024)上,提出了要“ 以應用為導向,以系統(tǒng)為核心”的戰(zhàn)略路徑,并支持以“開源開放、多元多模”的方式,激發(fā)生態(tài)創(chuàng)新,解決產(chǎn)業(yè)規(guī);l(fā)展問題。浪潮信息推出了企業(yè)大模型開發(fā)平臺“元腦企智”EPAI,升級元腦生態(tài),構(gòu)建多對多的平臺系統(tǒng),從而提高人工智能生態(tài)效率,以應對正在到來的企業(yè)大模型落地潮。
01
人工智能競爭要另辟蹊徑?
“人工智能的算力設(shè)計起點已經(jīng)到了萬卡級別,僅靠芯片提升還不夠,要從系統(tǒng)創(chuàng)新入手。”浪潮信息董事長彭震開門見山說。
最近,關(guān)于中國人工智能的發(fā)展道路,業(yè)界有不少討論。4月,全國政協(xié)經(jīng)濟委員會副主任、工業(yè)和信息化部原部長苗圩指出,這幾年我國算力與美國相比,逐漸被拉大。在技術(shù)相對落后的情況下,我們不應跟美國“打籃球賽”,而是應利用中國“下圍棋”的謀略,通過大模型賦能制造業(yè)等領(lǐng)域,實現(xiàn)人工智能應用,走一條差異化的發(fā)展道路。
彭震贊同這一觀點。他解釋說,此前中國互聯(lián)網(wǎng)行業(yè)也是因為和產(chǎn)業(yè)做了深度融合,造就了手機支付、電商、直播、物流業(yè)等的大發(fā)展。“人工智能時代也是應用為王,我們要發(fā)揮中國在應用上的創(chuàng)新試驗場和引領(lǐng)作用,促進千行百業(yè)的創(chuàng)新。”
中國工業(yè)經(jīng)濟學會會長江小涓看到,2023年中國制造業(yè)占全球的比重又增長一個百分點,達到近30%。中國有全球最大、可以承接人工智能落地應用的產(chǎn)業(yè)。
根據(jù)IDC的預測,到2027年,中國2/3的企業(yè)將利用生成式AI和RAG的組合,將決策效率提高55%。為此,到2026年,中國500強企業(yè)將把30%以上的核心IT支出用于AI。
實際上,2024年被認為是生成式AI在企業(yè)落地的元年。數(shù)智前線獲悉,從去年底今年初開始,大模型在行業(yè)的落地活躍度十分驚人。
一家工業(yè)服務(wù)商告訴數(shù)智前線,今年他們在工廠產(chǎn)線升級、設(shè)備能耗改造方面,落地項目預計至少幾百個。另一家服務(wù)商正在船舶業(yè)做試點,這些傳統(tǒng)行業(yè)老齡化嚴重,通過大模型降低對工人的技能要求,降本增效特別明顯。在交通業(yè),人們已盯上地鐵、航空設(shè)備運維大市場;在知名藥企,從靶點尋找、小分子藥物篩選到合同審批,大模型已逐步突破一個個環(huán)節(jié).....
在浪潮信息內(nèi)部,應用場景的挖掘也很活躍。彭震認為,每家企業(yè),要么在內(nèi)部業(yè)務(wù)流程,要么在外部產(chǎn)品服務(wù)體系上,都有大量應用場景適合大模型創(chuàng)新。
在這樣的形勢下,“如果在大模型應用方面走在全球前面,我們的人工智能也一定會走在全球前面。”彭震說。
除了以應用為導向,當下大模型的創(chuàng)新要以系統(tǒng)為核心。
大模型的突破是算法、數(shù)據(jù)、算力等多要素協(xié)同發(fā)展的結(jié)果。即便單看算力,如今也不全取決于芯片,大模型訓練算力設(shè)計的出發(fā)點是萬卡集群,甚至更大集群。
“這是一個全新的架構(gòu),不是以芯片為核心的單機系統(tǒng),而是以系統(tǒng)為核心的架構(gòu)。”彭震說。
“過去兩年,全球領(lǐng)先芯片的性能,實現(xiàn)了兩倍的跳躍,但趕不上我們對大模型訓練算力10倍、甚至百倍的增長需求。”北京智源人工智能研究院副院長兼總工程師林詠華說,哪怕是最先進的芯片,也要通過更多卡的互聯(lián),才能達到更大算力。
“所以,我們要通過系統(tǒng)創(chuàng)新,去解決今天芯片算力不足的問題。而且不是中國廠商算力不足,美國廠商算力也同樣不足。”彭震說。
而在系統(tǒng)創(chuàng)新中,計算、網(wǎng)絡(luò)、存儲、算法、數(shù)據(jù)工程等,一個都不能少。彭震舉例,浪潮信息曾在一個國產(chǎn)平臺上做大模型訓練,發(fā)現(xiàn)互聯(lián)帶寬非常低。但經(jīng)過算法層面的優(yōu)化,整個算力效率提升了33%。
在全球范圍,即便是OpenAI和英偉達取得的突破性進展,也都是系統(tǒng)級創(chuàng)新。以O(shè)penAI的Sora為例,資深人工智能專家、云知聲董事長梁家恩告訴數(shù)智前線,它的驚艷效果,背后是OpenAI對架構(gòu)設(shè)計、新算法組合和數(shù)據(jù)潛力的深刻洞察,以及精巧的系統(tǒng)構(gòu)思設(shè)計能力,而非簡單的“大力出奇跡”。
如何提升系統(tǒng)的效率,發(fā)揮系統(tǒng)的價值,將會是大模型領(lǐng)域重要的創(chuàng)新點。
02
從好算法到好應用并非易事
不過,大模型的落地仍面臨不小挑戰(zhàn),從一個好算法到好應用之間,還有巨大的鴻溝。
在大模型引發(fā)業(yè)界的巨大關(guān)注后,浪潮信息人士在拜訪客戶過程中,感受到了一種無力感。很多客戶表達了期望用大模型做智能化轉(zhuǎn)型,但如何與大模型結(jié)合,技術(shù)和應用中間有巨大的鴻溝。
“從某種程度上,我們現(xiàn)在不是缺大模型、缺技術(shù),而是缺場景、缺數(shù)據(jù),缺在一個場景下磨練大模型算法的能力。”彭震說。
浪潮信息逐漸意識到,要加速大模型在千行百業(yè)的創(chuàng)新,需要創(chuàng)造一個簡單易用的大模型開發(fā)環(huán)境,激發(fā)更多合作伙伴,能快速走入行業(yè)。
在開展大模型場景應用和落地的拓爾思董事長施水才看來,大模型落地講求三個“實”。第一個叫實戰(zhàn),AI落地工程化交付非常重要。第二個叫實用,用戶的剛性需求是什么?不能與用戶的業(yè)務(wù)需求對不上。第三個叫實效,企業(yè)要的是降本增效。生態(tài)各方要聚焦解決這三個問題。
在IFP2024期間,浪潮信息發(fā)布了企業(yè)大模型開發(fā)平臺EPAI,將落地的難點痛點,結(jié)合企業(yè)實踐、自身的KnowHow和方法論,形成一套工具鏈。
EPAI平臺上有多種基礎(chǔ)模型和數(shù)據(jù)集,并提供了數(shù)據(jù)準備、知識檢索、應用框架等系列工具,是端到端的一體化平臺。
EPAI平臺降低了大模型落地門檻。在浪潮信息內(nèi)部,一位售前工程師花了一個月,用對話方式,開發(fā)了“投標參數(shù)傾向分析”小程序。標書是企業(yè)競爭的風向標,只要將投標參數(shù)丟進小程序,它就能自動分析出參數(shù)傾向于哪家投標企業(yè),為下一步競爭策略提供參考。
值得關(guān)注的是,EPAI支持調(diào)度多元算力和多模算法。相比國外,中國大模型產(chǎn)業(yè)有著鮮明的特征——百芯百模、算力更多元、模型更多。據(jù)GitHub的不完全統(tǒng)計,截至2024年1月,國內(nèi)已有AI大模型243家,其中通用模型39個、金融模型25個、工業(yè)模型23個......與此同時,CPU、GPU、TPU、NPU各種芯片都參與了人工智能的創(chuàng)新。
“有些人認為這是重復造車,浪費生產(chǎn)力。”彭震說,但從歷史來看,很多技術(shù)誕生初期,都是百舸爭流、百家爭鳴,再通過市場之手選擇最后的技術(shù)。“我們要鼓勵開源開放,激勵多元多模。”
浪潮信息認為,在多元多模的支持上,自己有著優(yōu)勢和積累。“因為我們與所有芯片企業(yè)都是伙伴,與所有模型算法公司也是伙伴。這些伙伴在這個平臺上,可以獲得很大的誠意,并且能夠共享上萬家右手伙伴(應用開發(fā)服務(wù)商),覆蓋中國企業(yè)客戶,真正將大模型轉(zhuǎn)變?yōu)樯a(chǎn)力。”浪潮信息高級副總裁劉軍告訴數(shù)智前線。
實際上,實現(xiàn)多元多模并不容易。經(jīng)過三年多、多層面深度配合與研發(fā),在開展了大量適配、優(yōu)化等工作后,浪潮信息逐步支持多元多模;锇榛蚩蛻粼趹脗(cè)開發(fā)應用后,如果更換底層芯片,已不需要重寫代碼,這解決了煙囪林立型的生態(tài)。
EPAI平臺也推崇開源開放,來解決多元多模帶來的挑戰(zhàn)。比如,浪潮信息與百度、中國移動、中國工商銀行、國家電網(wǎng)等伙伴,發(fā)起成立了OCTC開放計算組織,發(fā)布大量標準和團標,如面向AI異構(gòu)協(xié)同計算的四項團標、面向液冷的首批冷板式液冷技術(shù)規(guī)范等,實現(xiàn)規(guī)模化的產(chǎn)業(yè)發(fā)展。
03
建設(shè)共生型生態(tài)
在IPF2024大會期間,不少企業(yè)表達了需要生態(tài)力量,一起從開源開放路徑,解決當下大模型訓練和落地中諸多挑戰(zhàn)的需求。
“多元算力并存肯定是趨勢,但從我們的角度,更關(guān)注芯片之上的軟件生態(tài)。”智源林詠華說。業(yè)界看到,目前多元AI芯片生態(tài)還相對比較割裂。它們的架構(gòu)不同,從編譯器到算子都自成一體。大模型企業(yè)要把訓練移植到這些芯片上,就不得不面對大量遷移工作。
今年全國很多地方都開始構(gòu)建智算中心,面對多元算力并存、網(wǎng)絡(luò)擁塞等核心問題,業(yè)界人士認為,只有進行標準化,才能推動下一代智算中心產(chǎn)業(yè)化的發(fā)展。“我們希望可以通過開源的力量,一起來做這樣的事。”林詠華說。
從事行業(yè)解決方案開發(fā)的中科軟董事長左春觀察,當下大模型在行業(yè)的落地,是幾方緊密合作的過程?蛻粢x擇模型,會提出一些落地方向;廠家要提供基座和工具來訓練模型;ISV(增值開發(fā)商)要為客戶進行知識梳理和知識訓練。
而在多元算力、多元模型、多元場景狀況下,如果讓每一家芯片廠商、模型廠商和開發(fā)合作伙伴,去對接成千上萬的企業(yè)客戶落地,效率太低。“我們今天要做一個多對多的平臺系統(tǒng)。”彭震說,來提高人工智能落地效率。
在EPAI平臺上,為左手伙伴和右手伙伴打造了公共的平臺和工具箱。從事解決方案開發(fā)的榮聯(lián)科技在2019年加入元腦生態(tài)。
榮聯(lián)科技首席科學家王向東注意到了元腦生態(tài)的平臺化。“這讓模式復制的效率會更高,邊際成本會不斷降低。”他進一步分析,“實質(zhì)上,這是以平臺帶動產(chǎn)品,以生態(tài)進行競爭,這個競爭模式在當下是領(lǐng)先的。”
“現(xiàn)在有一個詞叫‘FOMO’,意思是怕錯過。談到人工智能的發(fā)展,每個人都怕錯過,大家都在加速學習、亮相。”中科軟左春補充說,“我也看到了浪潮信息除了硬件支持以外,在系統(tǒng)軟件平臺上的努力。”
“我們很希望擁抱生態(tài),創(chuàng)業(yè)企業(yè)尤其需要生態(tài)的支持。”創(chuàng)業(yè)公司銜遠科技首席運營官、聯(lián)合創(chuàng)始人王曉波說。
在會議期間,浪潮信息多次表示,打造共生型生態(tài),支持客戶在“多元多模”上的選擇,支持開發(fā)合作伙伴和更多的模型廠商、芯片廠商發(fā)生聯(lián)系,建立合作關(guān)系,共同迎接大模型在企業(yè)落地上的大潮。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。