大模型研發(fā)席卷全球,“百模大戰(zhàn)”目前已經(jīng)走到了搶占落地先手的階段。
2023年,從PC端到學(xué)習(xí)機(jī),都在積極配合打造豐富的系統(tǒng)應(yīng)用場景,而手機(jī)作為和日常生活鏈接最為緊密的智能設(shè)備,與大模型的故事仿佛剛剛開始,大幕拉開,華為率先登場。
華為mate60自預(yù)告起就占盡先手,但此后,小米迅速推出了自己的大模型,OPPO、vivo等手機(jī)廠商也陸續(xù)加入,智能設(shè)備廠商大模型之爭硝煙彌漫,“軍備競賽”儼然打響,新的市場將幾分天下?這場大模型的高端局,華為能否繼續(xù)一枝獨秀呢?
01 目前來說,落地才是硬道理
根據(jù)IDC本月發(fā)布的報告,2023年,全球智能手機(jī)市場出貨量預(yù)測將會低于12億部,同比下降1.1%;而中國市場的出貨量預(yù)計僅有2.83億部,同比也下降約1.1%。據(jù)Counterpoint的數(shù)據(jù),2023年第二季度,中國智能手機(jī)銷量更是創(chuàng)2014年以來第二季度最低水平,同比下降4%,而就算是“618”大促期間,國內(nèi)手機(jī)銷量也大不如前,同比下降8%。
所以,全球手機(jī)消費市場領(lǐng)域需求明顯不足,期待新的變革,大模型承擔(dān)著在5G和6G之間掀起新一輪周期的希望。
高通中國區(qū)研發(fā)負(fù)責(zé)人徐皓表示:“大模型進(jìn)入終端是系統(tǒng)普及的必然過程,對大多數(shù)用戶或企業(yè)來說,能夠普及的、 有意義的應(yīng)用還是在終端。就像曾經(jīng)銀河系列巨型計算機(jī),可以算出非常復(fù)雜的太空飛行軌跡,但真正對普通民眾有意義的還是個人電腦。”而手機(jī)作為滲透現(xiàn)代人生活最為深刻的智能設(shè)備,不得不說確實可以稱得上是大模型落地的最強(qiáng)終端。
反過來我們還可以反思一下手機(jī)市場疲軟的原因,除了宏觀經(jīng)濟(jì)的因素外,主要原因大概有兩點,產(chǎn)品迭代快但代際差別不大,以及手機(jī)性能提高,消費者更換周期變長。所以大模型這種程度的顛覆性變革,同目前手機(jī)市場消費疲軟的原因極為契合。我們有理由相信,以華為產(chǎn)品為先聲的手機(jī)大模型革命能夠為活力不足的消費電子市場帶來一場狂歡。
同時,進(jìn)手機(jī),是大模型開發(fā)企業(yè)的必由之路:是運營過程中大量節(jié)約成本,提高效率的必然選擇。
初期的ChatGPT等大模型的訓(xùn)練是在云端進(jìn)行的,參數(shù)眾多,甚至達(dá)到百億或千億級,訓(xùn)練時需要眾多GPU提供算力,這種條件只有云端能提供,保 守估計每月算力成本就在1000萬美元上下。而一旦大模型訓(xùn)練完成,進(jìn)入到推理階段,企業(yè)就會對成本和安全有更多考慮。以大語言模型'為例,當(dāng)有大量用戶涌入進(jìn)行搜索時,成本將節(jié)節(jié)攀升,呈指數(shù)增長。此外,把推理任務(wù)分發(fā)出去不僅會逐漸降低成本,而且還可以提高處理效率,保護(hù)用戶隱私,促進(jìn)生態(tài)維穩(wěn)。
但回到當(dāng)前階段,大語言模型究竟可以在手機(jī)上發(fā)揮怎樣的價值還未可知,因為系統(tǒng)本身也在不斷演進(jìn),所以目前來說,落地才是硬道理。
由于一切乾坤未定,進(jìn)步和調(diào)整的路徑都需要在實踐中進(jìn)一步摸索,所以主要玩家身處大模型落地的初創(chuàng)期,要少談些未來,多走些實地。炒作概念,泡沫終將散去,只有先聚焦技術(shù)實現(xiàn),加速落地才能真正站穩(wěn)腳跟。
回到華為的問題上,現(xiàn)在切不可追究細(xì)節(jié),落地才是硬道理。盤古大模型的加入目前會提供一些諸如“摘要總結(jié)”、“信息檢索”、“智能翻譯”以及傳統(tǒng)的“語音撥打電話”、“語音查詢天氣”等服務(wù),雖有用戶反映未達(dá)到期待,但未來還是有相當(dāng)改進(jìn)空間的。
屆時到底哪個大語言模型更流行或者更有用,也要看具體的應(yīng)用場景。有可能是生成語言來回答問題、幫助用戶寫PPT、寫文檔、寫代碼、識別語言等等。所以盡快落地,摸索需求的方向和技術(shù)的邊界才是重點。
02 百模大戰(zhàn)搶到先手,華為做對了什么?
華為并不是第一個,也不是唯一一個嘗試將大模型裝進(jìn)手機(jī)的玩家,如前文所述,OPPO、vivo、小米也都在嘗試推出自己的大模型手機(jī),那么華為率先拉開二者相結(jié)合的序幕,到底做對了什么?
要解決這個問題,就要了解大模型進(jìn)入手機(jī)的核心要點,從云到端,達(dá)到云端協(xié)同。
具體來說就是,大模型需要首先在云端進(jìn)行訓(xùn)練,通過大數(shù)據(jù)分析和算法優(yōu)化得到高效的模型架構(gòu)和參數(shù),再將其部署到端側(cè)設(shè)備中,以實現(xiàn)本地化、實時性的智能服務(wù)。同時,云端平臺還可以對終端設(shè)備進(jìn)行遠(yuǎn)程管理和監(jiān)控。
理論上過程順暢,但實現(xiàn)過程中要經(jīng)歷從模型設(shè)計、數(shù)據(jù)處理、硬件升級、通信能力、安全性和隱私保護(hù)等方面的全方位優(yōu)化和技術(shù)創(chuàng)新。
首先,把大模型縮小是最大的挑戰(zhàn)。
據(jù)報道,截止今年5月,我國超過10億參數(shù)規(guī)模的大模型約79個,而千億規(guī)模以上的只有幾個,其中就包括華為的盤古大模型。盤古L0層基礎(chǔ)大模型最大版本包含1000億參數(shù),預(yù)訓(xùn)練使用了超3萬億tokens,將它放進(jìn)手機(jī),難度可以說是非常大了。
但需要注意的是,盤古大模型實際上分為了四個版本,分別是100億參數(shù)、380億參數(shù)、710億參數(shù)和1000億參數(shù)?紤]到手機(jī)的硬件性能和運行環(huán)境,鴻蒙4中搭載的,很有可能是100億參數(shù)版本的盤古大模型。
想在這100億的數(shù)據(jù)規(guī)模上,保障大模型的準(zhǔn)確性、可靠性,可能嗎?
對于這個問題,華為有兩種可能的解決方案:首先一種,是直接將鴻蒙4中的大模型,變成一個看似通用的“專用”大模型,采取小而精的策略。因為在某些特定場景,預(yù)訓(xùn)練數(shù)據(jù)的質(zhì)量和相關(guān)性,遠(yuǎn)比其數(shù)量和范圍要重要得多。
而第二種方式,則是通過“壓縮”的方式,在不犧牲性能和精度的情況下,降低模型的參數(shù)。華為在該模型的訓(xùn)練過程主要采用了昇騰絕對模型壓縮、參數(shù)量子化、模型蒸餾和知識蒸餾等技術(shù),讓這個模型不僅具備強(qiáng)大的計算能力,還能夠兼顧效率和速度。
其次,大模型從云端進(jìn)入手機(jī),對端測設(shè)備硬件基礎(chǔ)設(shè)施的要求也相應(yīng)提高,倒逼硬件升級。
將大模型裝進(jìn)手機(jī)需要手機(jī)具備相應(yīng)的硬件支持,包括高性能的處理器、大容量的存儲空間、高內(nèi)存以及其他的硬件加速設(shè)備。
Mate 60 Pro所搭載的是麒麟9000S芯片。計算和推理及硬件加速設(shè)備方面,GPU Maleoon 910性能直逼英偉達(dá)A100,在AI芯片領(lǐng)域,其處理速度比業(yè)界同類產(chǎn)品快80%以上。華為輪值董事更是介紹到,Mate 60 Pro搭載的芯片幾乎是當(dāng)前全球算力最強(qiáng)、訓(xùn)練速度最快的。
空間方面,大模型需要大量的存儲空間來存儲模型本身以及處理數(shù)據(jù),Mate 60 Pro使麒麟9000s和儲存顆粒堆疊,雖然散熱條件受損,但儲存性能獲得直線提升,512G與1T的空間,為大模型的運行留出余地。
最為重要的是,這塊麒麟9000S芯片,極有可能是華為海思完全自主研發(fā),這就意味著,華為擁有一條世界領(lǐng)先的芯片生產(chǎn)線,不受到任何國家、企業(yè)的限制,擁有完全自主權(quán),為大模型手機(jī)的順利運營提供了最為堅實的基礎(chǔ)。
相應(yīng)的問題就是,硬件的提升必然帶來價格的提高,對于消費者來說并不友好。但23年手機(jī)市場數(shù)據(jù)表明,在消費電子市場整體疲軟的背景下,國內(nèi)市場600美元以上的高端機(jī)銷售額在第二季度逆勢增長23.1%。這就證明,高端機(jī)市場的需求還是相當(dāng)旺盛。
03 大模型進(jìn)手機(jī)的高端局,華為能一枝獨秀下去嗎?
雖然華為大模型手機(jī)已經(jīng)有了一定程度的進(jìn)展,但要真正完成從云到端的跨越,并非一件容易的事,是各大產(chǎn)品、軟件開發(fā)公司的難題,也是科技部下一代人工智能重點重大國家課題。
從全產(chǎn)業(yè)鏈出發(fā),這件事情根本不是華為單打獨斗能夠拼出來的,要保持行業(yè)領(lǐng)先地位,就需要多個環(huán)節(jié)的通力協(xié)同合作。
模型設(shè)計及開發(fā)環(huán)節(jié),需要對其結(jié)構(gòu)、參數(shù)和訓(xùn)練數(shù)據(jù)進(jìn)行優(yōu)化和壓縮,盡力降低復(fù)雜度。訓(xùn)練方法和算法優(yōu)化方面,需要高效的算法提高訓(xùn)練效率,以針對具體的應(yīng)用場景隨機(jī)應(yīng)變以上環(huán)節(jié),華為的開發(fā)團(tuán)隊還能夠自行完成,但數(shù)據(jù)收集與處理,硬件產(chǎn)品支持以及應(yīng)用場景的開發(fā)就一定會隨著大模型與手機(jī)結(jié)合的深入,逐漸需要與產(chǎn)業(yè)鏈不同環(huán)節(jié)進(jìn)行深入合作了。
數(shù)據(jù)收集和處理的過程中,大量用于訓(xùn)練和優(yōu)化模型的數(shù)據(jù)都必須進(jìn)行收集、整理、標(biāo)注和處理,這就要求不同的數(shù)據(jù)處理中心同時協(xié)作,提供優(yōu)質(zhì)數(shù)據(jù)服務(wù)。同時,模型的學(xué)習(xí)和運行過程中還需要相應(yīng)的算力服務(wù)作為支撐,涉及產(chǎn)業(yè)鏈上游的算力租賃公司。
同時,如果要使模型更小,就需要采用更高效的壓縮和優(yōu)化技術(shù),訓(xùn)練和部署模型要求更強(qiáng)大的硬件支持,例如 GPU、TPU 芯片。這就要求同中芯國際等芯片廠家進(jìn)行合作。
總之,將大模型縮小不僅需要技術(shù)上的支持,還需要各個環(huán)節(jié)的共同努力。只有通過合作、協(xié)作和創(chuàng)新,才能實現(xiàn)模型的縮小和優(yōu)化,并最終實現(xiàn)更好的應(yīng)用效果。
不僅把模型縮小的開發(fā)階段需要產(chǎn)業(yè)鏈各環(huán)節(jié)通力合作,后續(xù)大模型手機(jī)在應(yīng)用、發(fā)展階段更需要的是一個欣欣向榮,和諧互補(bǔ)的生態(tài)環(huán)境。
未來,在開發(fā)過程中大模型就需要與各行業(yè)公司進(jìn)行深度合作,以便將手機(jī)設(shè)備與各種智能家居、辦公等場景深度融合。
應(yīng)用和發(fā)展階段,大模型手機(jī)需要一個良好的生態(tài)環(huán)境來促進(jìn)其廣泛應(yīng)用和創(chuàng)新。這包括各種應(yīng)用軟件的開發(fā)與更新,以及軟件生態(tài)的共建共享。只有在這樣的生態(tài)環(huán)境下,搭載了外腦的智能終端才能充分發(fā)揮潛力,成為消費者的得力助手。
大模型手機(jī)在多元化創(chuàng)新領(lǐng)域具有豐富的想象空間。例如,妙鴨相機(jī)就是一個很好的例子,通過大模型手機(jī),消費者可以輕松實現(xiàn)各種創(chuàng)意拍攝,豐富社交內(nèi)容。未來,隨著技術(shù)的不斷發(fā)展,大模型手機(jī)有望在更多領(lǐng)域帶來更多創(chuàng)新應(yīng)用。
此外,需要特別關(guān)注的是,這場云到端的較量,華為不僅不可一枝獨秀,盤古本身是否適合手機(jī)終端還是一個值得商榷的問題。華為官方曾宣布,盤古并非注重語言和互動的大模型,而是“不會寫詩,只做實事”,面向行業(yè),踐行“AI for industries”的典型。簡而言之,盤古大模型強(qiáng)調(diào)在細(xì)分場景的落地應(yīng)用,主要解決商業(yè)環(huán)境中低成本大規(guī)模定制的問題,和C端用戶日常使用場景能否成功磨合呢?目前還需要等待市場更完整的反饋。
作者:一顆菠菜
來源:松果智能
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。