合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測(cè)試版現(xiàn)已開放革命性AI對(duì)話系統(tǒng)Moshi問世:機(jī)器也能說人話了?
  • 晉升業(yè)內(nèi)新寵兒,MoE模型給了AI行業(yè)兩條關(guān)鍵出路

    2024年07月11日 17:40:41   來源:智能相對(duì)論

      文 | 智能相對(duì)論

      作者 | 陳泊丞

      今年以來,MoE模型成了AI行業(yè)的新寵兒。

      一方面,越來越多的廠商在自家的閉源模型上采用了MoE架構(gòu)。在海外,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1等主流大模型都采用了MoE架構(gòu)。

      而在國內(nèi),昆侖萬維推出的天工3.0、浪潮信息發(fā)布的源2.0-M32、通義千問團(tuán)隊(duì)發(fā)布的Qwen1.5-MoE-A2.7B、MiniMax全量發(fā)布的abab6、幻方量化旗下的DeepSeek發(fā)布的DeepSeek-MoE 16B等等也都屬于MoE模型。

      另一方面,在MoE模型被廣泛應(yīng)用的同時(shí),也有部分廠商爭先開源了自家的MoE模型。前不久,昆侖萬維宣布開源2千億參數(shù)的Skywork-MoE。而在此之前,浪潮信息的源2.0-M32、DeepSeek的DeepSeek-MoE 16B等,也都紛紛開源。

      為什么MoE模型如此火爆,備受各大廠商的青睞?在開源的背后,MoE模型又是以什么樣的優(yōu)勢(shì)使各大主流廠商成為其擁躉,試圖作為改變AI行業(yè)的利器?

      MoE模型火爆的背后:全新的AI解題思路

      客觀來說,MoE模型的具體工作原理更接近中國的一句古語“術(shù)業(yè)有專攻”,通過把任務(wù)分門別類,然后分給多個(gè)特定的“專家”進(jìn)行解決。

      它的工作流程大致如此,首先數(shù)據(jù)會(huì)被分割為多個(gè)區(qū)塊(token),然后通過門控網(wǎng)絡(luò)技術(shù)(Gating Network)再把每組數(shù)據(jù)分配到特定的專家模型(Experts)進(jìn)行處理,也就是讓專業(yè)的人處理專業(yè)的事,最終匯總所有專家的處理結(jié)果,根據(jù)關(guān)聯(lián)性加權(quán)輸出答案。

      當(dāng)然,這只是一個(gè)大致的思路,關(guān)于門控網(wǎng)絡(luò)的位置、模型、專家數(shù)量、以及MoE與Transformer架構(gòu)的具體結(jié)合方案,各家方案都不盡相同,也逐漸成為各家競爭的方向——誰的算法更優(yōu),便能在這個(gè)流程上拉開MoE模型之間的差距。

      像浪潮信息就提出了基于注意力機(jī)制的門控網(wǎng)絡(luò)(Attention Router),這種算法結(jié)構(gòu)的亮點(diǎn)在于可以通過局部過濾增強(qiáng)的注意力機(jī)制(LFA, Localized Filtering-based Attention),率先學(xué)習(xí)相鄰詞之間的關(guān)聯(lián)性,然后再計(jì)算全局關(guān)聯(lián)性的方法,能夠更好地學(xué)習(xí)到自然語言的局部和全局的語言特征,對(duì)于自然語言的關(guān)聯(lián)語義理解更準(zhǔn)確,從而更好地匹配專家模型,保證了專家之間協(xié)同處理數(shù)據(jù)的水平,促使模型精度得以提升。

      拋開目前各家廠商在算法結(jié)構(gòu)上的創(chuàng)新與優(yōu)化不談,MoE模型這種工作思路本身所帶來的性能提升就非常顯著——通過細(xì)粒度的數(shù)據(jù)分割和專家匹配,從而實(shí)現(xiàn)了更高的專家專業(yè)化和知識(shí)覆蓋。

      這使得MoE模型在處理處理復(fù)雜任務(wù)時(shí)能夠更準(zhǔn)確地捕捉和利用相關(guān)知識(shí),提高了模型的性能和適用范圍。因此,「智能相對(duì)論」嘗試了去體驗(yàn)天工3.0加持的AI搜索,就發(fā)現(xiàn)對(duì)于用戶較為籠統(tǒng)的問題,AI居然可以快速的完成拆解,并給出多個(gè)項(xiàng)目參數(shù)的詳細(xì)對(duì)比,屬實(shí)是強(qiáng)大。

      由此我們可以看到,AI在對(duì)比兩款車型的過程中,巧妙地將這一問題拆解成了續(xù)航里程、動(dòng)力性能、外觀設(shè)計(jì)、內(nèi)飾設(shè)計(jì)、智能化與自動(dòng)駕駛、市場表現(xiàn)與用戶口碑、價(jià)格等多個(gè)項(xiàng)目,分別處理得出較為完整且專業(yè)的答案。

      這便是“術(shù)業(yè)有專攻”的優(yōu)勢(shì)——MoE模型之所以受到越來越多廠商的關(guān)注,首要的關(guān)鍵就在于其所帶來的全新解決問題的思路促使模型的性能得到了較為顯著的提高。特別是伴隨著行業(yè)復(fù)雜問題的涌現(xiàn),這一優(yōu)勢(shì)將使得MoE模型得到更廣泛的應(yīng)用。

      各大廠商爭先開源MoE模型:解決AI算力荒的另一條路徑

      開源的意義在于讓MoE模型更好的普及。那么,對(duì)于市場而言,為什么要選擇MoE模型?

      拋開性能來說,MoE模型更突出的一點(diǎn)優(yōu)勢(shì)則在于算力效率的提升。

      DeepSeek-MoE 16B在保持與7B參數(shù)規(guī)模模型相當(dāng)?shù)男阅艿耐瑫r(shí),只需要大約40%的計(jì)算量。而37億參數(shù)的源2.0-M32在取得與700億參數(shù)LLaMA3相當(dāng)性能水平的同時(shí),所消耗的算力也僅為LLaMA3的1/19。

      也就意味著,同樣的智能水平,MoE模型可以用更少的計(jì)算量和內(nèi)存需求來實(shí)現(xiàn)。這得益于MoE模型在應(yīng)用中并非要完全激活所有專家網(wǎng)絡(luò),而只需要激活部分專家網(wǎng)絡(luò)就可以解決相關(guān)問題,很好避免了過去“殺雞用牛刀”的尷尬局面。

      舉個(gè)例子,盡管DeepSeek-MoE 16B的總參數(shù)量為16.4B,但每次推理只激活約2.8B的參數(shù)。與此同時(shí),它的部署成本較低,可以在單卡40G GPU上進(jìn)行部署,這使得它在實(shí)際應(yīng)用中更加輕量化、靈活且經(jīng)濟(jì)。

      在當(dāng)前算力資源越來越緊張的“算力荒”局面下,MoE模型的出現(xiàn)和應(yīng)用可以說為行業(yè)提供了一個(gè)較為現(xiàn)實(shí)且理想的解決方案。

      更值得一提的是,MoE模型還可以輕松擴(kuò)展到成百上千個(gè)專家,使得模型容量極大增加,同時(shí)也允許在大型分布式系統(tǒng)上進(jìn)行并行計(jì)算。由于各個(gè)專家只負(fù)責(zé)一部分?jǐn)?shù)據(jù)處理,因此在保持模型性能的同時(shí),又能顯著降低了單個(gè)節(jié)點(diǎn)的內(nèi)存和計(jì)算需求。

      如此一來,AI能力的普惠便有了非常可行的路徑。這樣的特性再加上廠商開源,將促使更多中小企業(yè)不需要重復(fù)投入大模型研發(fā)以及花費(fèi)過多算力資源的情況下便能接入AI大模型,獲取相關(guān)的AI能力,促進(jìn)技術(shù)普及和行業(yè)創(chuàng)新。

      當(dāng)然,在這個(gè)過程中,MoE模型廠商們?cè)跒槭袌鎏峁╅_源技術(shù)的同時(shí),也有機(jī)會(huì)吸引更多企業(yè)轉(zhuǎn)化成為付費(fèi)用戶,進(jìn)而走通商業(yè)化路徑。畢竟,MoE模型的優(yōu)勢(shì)擺在眼前,接下來或許將有更多的企業(yè)斗都會(huì)嘗試新的架構(gòu)來拓展AI能力,越早開源越能吸引更多市場主體接觸并參與其中。

      但是,開源最關(guān)鍵的優(yōu)勢(shì)還是在于MoE模型對(duì)當(dāng)前算力問題的解決;蛟S,隨著MoE模型被越來越多的企業(yè)所接受并應(yīng)用,行業(yè)在獲得相應(yīng)AI能力的同時(shí)也不必困頓于算力資源緊張的問題了。

      寫在最后

      MoE大模型作為當(dāng)前人工智能領(lǐng)域的技術(shù)熱點(diǎn),其獨(dú)特的架構(gòu)和卓越的性能為人工智能的發(fā)展帶來了新的機(jī)遇。不管是應(yīng)用還是開源,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,MoE大模型有望在更多領(lǐng)域發(fā)揮巨大的潛力。

      MoE模型的本質(zhì)在于為AI行業(yè)的發(fā)展提供了兩條思路,一是解決應(yīng)用上的性能問題,讓AI有了更強(qiáng)大的解題思路。二是解決算力上的欠缺問題,讓AI有了更全面的發(fā)展空間。由此來看MoE模型能成為行業(yè)各大廠商的寵兒,也是水到渠成的事情。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。