本文來(lái)自于微信公眾號(hào) 元宇宙日爆(ID:MBNews),作者:凱爾。
一股“端側(cè)大模型”浪潮正在涌來(lái)。華為、高通等芯片巨頭正探索將AI大模型植入端側(cè),讓手機(jī)實(shí)現(xiàn)新一代物種進(jìn)化。
相比ChatGPT、Midjourney等AI應(yīng)用依賴云端服務(wù)器提供服務(wù),端側(cè)大模型主打在本地實(shí)現(xiàn)智能化。它的優(yōu)勢(shì)在于能夠更好地保護(hù)隱私,同時(shí)讓手機(jī)能通過(guò)學(xué)習(xí)成為用戶的私人智能助手,還不必?fù)?dān)心云端服務(wù)器宕機(jī)等問(wèn)題。
不過(guò),現(xiàn)有技術(shù)條件下,手機(jī)性能遠(yuǎn)不足以支撐大模型運(yùn)行。業(yè)內(nèi)主流的技術(shù)方案是,通過(guò)剪枝、量化、蒸餾來(lái)給大模型“瘦身”,在盡可能少地減損精度的前提下,降低它所需的資源和能耗。
高通已經(jīng)開始研發(fā)用于端側(cè)大模型的芯片。這預(yù)示著,部署AI模型的手機(jī)終端正在向我們走來(lái)。
手機(jī)廠商將大模型引向移動(dòng)端
AI大模型正在從云端向智能終端狂奔。
8月4日,在2023年華為開發(fā)者大會(huì)上,華為對(duì)外發(fā)布HarmonyOS4,相比前幾代操作系統(tǒng),它最顯著的一大變化是,將AI大模型能力內(nèi)置在了系統(tǒng)底層。華為正在拉開AI模型走向“智能終端側(cè)”的序幕。
目前,人們使用ChatGPT、Midjourney等AI應(yīng)用提供的服務(wù),基本都是通過(guò)云端服務(wù)器來(lái)完成。以ChatGPT為例,它背后的大模型和計(jì)算資源都存儲(chǔ)在遠(yuǎn)程服務(wù)器上,用戶通過(guò)與服務(wù)器實(shí)時(shí)交互,被輸入的文本經(jīng)服務(wù)器處理后,獲得返回響應(yīng)。這樣的好處在于,可以確保模型的高效穩(wěn)定運(yùn)行,因?yàn)榉⻊?wù)器通常配置了強(qiáng)大的計(jì)算資源,而且可以隨時(shí)擴(kuò)展以適應(yīng)高負(fù)載。
如今,新的支持邏輯出現(xiàn)了。華為正在嘗試將大模型引入終端,這意味著上述所有工作都能在本地完成,手機(jī)系統(tǒng)本身就具備了一定的AI能力,不需要接入AI云端服務(wù),也能實(shí)現(xiàn)智能化升級(jí)。
華為常務(wù)董事、終端BG CEO余承東介紹,HarmonyOS4由華為盤古大模型提供底層支持,希望給用戶帶來(lái)智慧終端交互、高階生產(chǎn)力效率、個(gè)性化服務(wù)的全新AI體驗(yàn)變革。
HarmonyOS4的AI能力目前主要由華為智慧助手“小藝”體現(xiàn)。大模型接入后,小藝在語(yǔ)音交互的基礎(chǔ)上,擴(kuò)展了文字、圖片和文檔等多種形式的輸入,自然語(yǔ)言理解能力得到提升。小藝還能根據(jù)指令,連接多種服務(wù)和場(chǎng)景,比如自動(dòng)提取圖片文字,生成各類商業(yè)電子郵件內(nèi)容或生成圖像等。
更重要的改變是,小藝具備了記憶和學(xué)習(xí)能力,隨著不斷使用,它將變得越來(lái)越懂“主人”,能夠智能給出出行、活動(dòng)計(jì)劃等方案,并根據(jù)根據(jù)用戶習(xí)慣,實(shí)現(xiàn)個(gè)性化推薦。華為透露,小藝這些新的能力,將在8月下旬開啟公開測(cè)試體驗(yàn)。
將AI大模型內(nèi)置于手機(jī)系統(tǒng)底層,華為希望借此全盤提升手機(jī)的智能化程度。雖然小藝的上述功能并不“高深”,但要實(shí)現(xiàn)起來(lái),用戶往往需要同時(shí)調(diào)用ChatGPT、Midjourney等眾多應(yīng)用才能完成。當(dāng)手機(jī)本身有了AI能力后,它就像一個(gè)更全能的助手,提供全面的服務(wù)。
在HarmonyOS4發(fā)布之前,華為其實(shí)已經(jīng)嘗試過(guò)將AI大模型接入移動(dòng)終端。今年3月,華為發(fā)布P60手機(jī),其中自帶的智慧搜圖功能就是基于多模態(tài)大模型技術(shù),通過(guò)在手機(jī)側(cè)對(duì)模型做小型化處理,實(shí)現(xiàn)了手機(jī)端的自然語(yǔ)言模型運(yùn)行。
將AI模型引入端側(cè),華為并不是頭一家。在2023世界人工智能大會(huì)上,高通展示了大模型進(jìn)入端側(cè)的操作實(shí)踐,將生成式AI模型Stable Diffusion放在搭載了第二代驍龍8的手機(jī)上運(yùn)行,15秒內(nèi)執(zhí)行了20步推理,并生成了一張512x512像素的圖像,且圖像效果與云端處理水平相差并不明顯。
在上海MWC2023期間,榮耀CEO趙明也表示,榮耀將在智能手機(jī)端推動(dòng)部署端側(cè)大模型,以此實(shí)現(xiàn)多模態(tài)自然交互、精準(zhǔn)意圖識(shí)別、復(fù)雜任務(wù)的閉環(huán)服務(wù)等體驗(yàn)。
備受矚目的還有蘋果,一個(gè)月前,蘋果被曝出正在秘密研發(fā)“AppleGPT”,它是一款基于蘋果自研的Ajax框架開發(fā)的人工智能工具。盡管具體的細(xì)節(jié)尚有待披露,但業(yè)內(nèi)普遍猜測(cè),蘋果很可能在系統(tǒng)層加入大模型,提升提升語(yǔ)音助手Siri的智力,讓Siri摘掉“人工智障”的帽子。
炒作還是新革命?
手機(jī)廠商盯上大模型不稀奇,但為啥他們要走“端側(cè)”路線?畢竟,華為小藝的交互、生成能力通過(guò)云端服務(wù)器也能提供,而且看起來(lái)成本更經(jīng)濟(jì)、技術(shù)實(shí)現(xiàn)更容易。
把AI大模型裝進(jìn)智能移動(dòng)端,是炒作還是確實(shí)有其必要性?在這一問(wèn)題上,無(wú)論是余承東還是趙明,都提到了兩個(gè)關(guān)鍵詞:隱私安全和個(gè)性化。
余承東強(qiáng)調(diào),華為主張所有AI體驗(yàn)創(chuàng)新和場(chǎng)景設(shè)計(jì)的第一原則是安全與隱私保護(hù),打造更負(fù)責(zé)任的AI,并承諾AI生成的內(nèi)容都會(huì)進(jìn)行標(biāo)識(shí)。
相比在云端處理數(shù)據(jù),智能終端側(cè)最明顯的優(yōu)勢(shì)在于隱私安全。此前,ChatGPT屢次陷入數(shù)據(jù)泄露風(fēng)波。今年3月,三星在內(nèi)部發(fā)布了ChatGPT使用禁令,起因是半導(dǎo)體員工疑似因使用ChatGPT泄露了公司機(jī)密;上個(gè)月,ChatGPT背后公司OpenAI及其股東微軟被16人匿名起訴,控訴他們?cè)谖唇?jīng)允許的情況下使用并泄露了個(gè)人隱私數(shù)據(jù),索賠金額高達(dá)30億美元。
當(dāng)數(shù)據(jù)處理都在端側(cè),用戶的個(gè)人數(shù)據(jù)將不會(huì)上傳至云端服務(wù)器,大幅降低了隱私泄露風(fēng)險(xiǎn)。這也為手機(jī)AI助手真正變成生活管家提供了先決條件——只有隱私得到保障,用戶才會(huì)放心將數(shù)據(jù)交給AI去學(xué)習(xí)。
在趙明的理解中,端側(cè)AI大模型的使命就是更好地理解用戶,“知道我?guī)c(diǎn)睡覺(jué),知道我喜歡吃什么,能解決我的即時(shí)需求,相當(dāng)于擁有洞察我需求的能力。”而要做到這些,就需要AI基于用戶的個(gè)人數(shù)據(jù)和習(xí)慣進(jìn)行訓(xùn)練,最終智能手機(jī)將有希望成為全能助手,或者說(shuō)是私人機(jī)器人秘書,能夠幫助用戶解決餐飲、訂票、咨詢、娛樂(lè)、辦公等多場(chǎng)景的需求。
相比之下,無(wú)論是ChatGPT還是其他主流的AI應(yīng)用,都是標(biāo)準(zhǔn)化產(chǎn)品,在不加改造的情況下很難具備私人助手的能力,它并不了解用戶,只是根據(jù)用戶的輸入指令做出相應(yīng)的回應(yīng)。個(gè)人手機(jī)已經(jīng)是一個(gè)私有的個(gè)人智能設(shè)備,如果理解人類語(yǔ)言的AI模型能跑在手機(jī)上,智能化程度無(wú)疑將得到大提升。
另外,依賴云端的應(yīng)用也存在不穩(wěn)定性,比如由于網(wǎng)絡(luò)或服務(wù)器原因,云端的響應(yīng)速度可能會(huì)變慢,甚至干脆宕機(jī),這在ChatGPT上已經(jīng)出現(xiàn)多次,本地化的大模型將大大削弱對(duì)云端的依賴,從而避免“云卡頓”。
基于上述特點(diǎn),大模型的“端側(cè)革命”展現(xiàn)出了潛力,甚至有希望讓進(jìn)入發(fā)展瓶頸多年的手機(jī)再來(lái)一次激動(dòng)人心的物種進(jìn)化,就像當(dāng)年大屏智能手機(jī)的出現(xiàn)以及iPhone發(fā)布時(shí)刻一樣。
但大模型想在手機(jī)端發(fā)揮實(shí)力存在一個(gè)顯而易見的問(wèn)題:手機(jī)芯片頂?shù)米?由于大模型動(dòng)輒包含上百億、千億的參數(shù),且需要天文級(jí)的訓(xùn)練,消耗龐大的算力,現(xiàn)有手機(jī)芯片的性能顯然無(wú)法滿足要求。
對(duì)此,業(yè)內(nèi)目前較主流的解決方案是“模型小型化”。
簡(jiǎn)單來(lái)說(shuō),當(dāng)模型網(wǎng)絡(luò)結(jié)構(gòu)確定后,在盡可能少地降低精度的前提下,給模型“瘦身”,從而降低它所需的資源和能耗。這一過(guò)程通常有三步,將模型中對(duì)精度影響非常小的參數(shù)裁剪掉,被稱為“剪枝”;使用更低精度的數(shù)據(jù)類型進(jìn)行推理,行話叫“量化”;而從復(fù)雜的模型中,提取出效果相近但更加簡(jiǎn)單的模型,被形象地稱作“蒸餾”。最終目的,都是為了減小模型體積。
另一方面,高通等芯片廠商,也在針對(duì)AI大模型端側(cè)部署研發(fā)專用的芯片。此前,高通5G移動(dòng)平臺(tái)驍龍8Gen2首度集成的AI專用Hexagon處理器,采用了獨(dú)立的專用供電系統(tǒng),支持微切片推理、INT4精度和Transformer網(wǎng)絡(luò)加速等,能在提供更高性能的同時(shí),降低能耗和內(nèi)存占用。
端側(cè)大模型正在掀起新一代智能終端革命。IDC預(yù)測(cè),到2026年,中國(guó)市場(chǎng)中近50%的終端設(shè)備的處理器將帶有AI引擎技術(shù)。AI帶給人類科技生活的又一個(gè)巨變或?qū)⒊霈F(xiàn)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。