家庭能源智聯(lián)自由 海辰儲(chǔ)能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o(jì)3:AI 推理能力的重大突破,得分高達(dá)87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團(tuán)外賣(mài)出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動(dòng)6000億GTV后,抖音計(jì)劃偷襲美團(tuán)大本營(yíng)AGI Open Network(AON):賦能每個(gè)人創(chuàng)建、部署和貨幣化AI Agent貸款利率史上最低了嗎?東融教你看懂歷年啥水平“客服來(lái)電”有詐?抖音客服上線“驗(yàn)證助手”助用戶識(shí)別詐騙OpenAI新模型GPT-5研發(fā)未達(dá)預(yù)期:成本高昂 效果不佳曝天馬打入果鏈:為蘋(píng)果HomePod供應(yīng)LCD屏 每塊屏僅10美元曝OPPO或首發(fā)新款天璣次旗艦芯片 兩大子品牌Q2發(fā)力諾基亞攜手阿聯(lián)酋運(yùn)營(yíng)商e&,展示全球首個(gè)固網(wǎng)游戲端到端網(wǎng)絡(luò)切片方案零下25℃制熱26℃!海爾水暖通黑科技亮相冰雪大世界三星沒(méi)放棄曲面屏開(kāi)發(fā)!最新專(zhuān)利曝光暗示有望回歸三大運(yùn)營(yíng)商11月成績(jī)單:用戶數(shù)據(jù)增幅放緩打造下一個(gè)英偉達(dá),孫正義的2026芯片計(jì)劃曝光瞭望2025全球6G技術(shù)發(fā)展趨勢(shì)AI時(shí)代云安全新范式,暢捷通智能守護(hù)小微企業(yè)安全上云百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型 Baichuan4-Finance
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    把大模型裝進(jìn)手機(jī),總共分幾步?

    2023年11月15日 15:22:35   來(lái)源:微信公眾號(hào)腦極體

      本文來(lái)自微信公眾號(hào)“腦極體”(ID:unity007),作者:藏狐。

      年初ChatGPT爆火的時(shí)候,我去上海參加華為春季新品發(fā)布會(huì),用一頁(yè)keynote提到了大模型技術(shù)與手機(jī)硬件的結(jié)合。雖然只有短短的一兩分鐘,但我專(zhuān)門(mén)發(fā)了一條朋友圈,看好自然語(yǔ)言交互能力在手機(jī)上的應(yīng)用。

      當(dāng)時(shí)我就有預(yù)感,大語(yǔ)言模型跟手機(jī)結(jié)合,應(yīng)該會(huì)很快。

      時(shí)間拉回到現(xiàn)在,蘋(píng)果、三星,以及“華米OV”國(guó)產(chǎn)手機(jī)廠商,都先后宣布了落地大模型。對(duì)手機(jī)來(lái)說(shuō),有沒(méi)有大模型,已經(jīng)不是一道選擇題了,而是一道必答題。

      提起這段故事,不是想說(shuō)我們預(yù)判有多準(zhǔn),做科技觀察不是玄學(xué)算命,一切都是有規(guī)律可循的。2023即將尾聲,但大模型手機(jī)的熱鬧方興未艾,是時(shí)候總結(jié)性地聊一聊,手機(jī)和大模型結(jié)合的深層邏輯,目前各家的差異化打法和挑戰(zhàn)是什么,以及未來(lái)會(huì)如何發(fā)展。

      2023,手機(jī)大模型的

      基建元年

      首先有必要解釋一下,為什么我們會(huì)預(yù)判,大模型與手機(jī)的結(jié)合,是一種必然?

      了解手機(jī)市場(chǎng)近況的讀者應(yīng)該知道,在輝煌了十余年之后,移動(dòng)智能終端已經(jīng)陷入了某種瓶頸,增長(zhǎng)低迷、缺少亮點(diǎn),廠商創(chuàng)新如同擠牙膏,開(kāi)發(fā)者巧婦難為無(wú)米之炊,可施展的創(chuàng)意空間有限。與此同時(shí),一個(gè)用戶身邊至少環(huán)繞著三四個(gè)移動(dòng)設(shè)備,每天要為繁瑣交互,付出大量的隱形勞動(dòng),甚至有人不勝其煩,開(kāi)始嘗試“數(shù)字戒斷”。

      可以說(shuō),移動(dòng)數(shù)字服務(wù)的供需雙方,都在期待一種新的變革技術(shù),可以讓移動(dòng)智能終端生態(tài)化繁為簡(jiǎn)、重塑體驗(yàn)。而在今天的技術(shù)世界中,大模型是最佳選項(xiàng)。

      大語(yǔ)言模型的強(qiáng)大理解和生成能力,各種功能用同一個(gè)模型基座和自然語(yǔ)言交互來(lái)獲取,可以改變手機(jī)的多個(gè)基本能力,說(shuō)是重新定義手機(jī),也不為過(guò)。

      讓大模型跑在手機(jī)上,成了手機(jī)廠商的必爭(zhēng)之地,開(kāi)發(fā)者所需要的機(jī)會(huì)窗口,也是重新點(diǎn)燃用戶熱情的一種必然選項(xiàng)。

      大家今年都聽(tīng)說(shuō)了“百模大戰(zhàn)”,但跟主要在云端訓(xùn)練、web調(diào)用的通用大語(yǔ)言模型不同,高度集成化的手機(jī),端側(cè)算力、OS操作系統(tǒng)、應(yīng)用并發(fā)、UI交互等一系列軟硬件,都有自身的特性,也給大模型落地帶來(lái)了不少限制。

      結(jié)合華米OV等頭部廠商的行動(dòng)方略來(lái)看,我們預(yù)判,2023將是手機(jī)大模型的基建元年。

      大模型落地手機(jī),基建工程剛剛開(kāi)始,后面會(huì)有更多好戲可看。具體來(lái)說(shuō),廠商必須搞定:

      1.三座基建。

      2.一個(gè)入口。

      3.一群人。

      我們就從這三個(gè)層面,來(lái)看看目前,各家的情況都怎么樣?有哪些共同挑戰(zhàn)和差異化思路?

      第一步

      端側(cè)部署,三個(gè)基建

      大語(yǔ)言模型的參數(shù)量動(dòng)輒百億、千億,其訓(xùn)練和推理過(guò)程,需要耗費(fèi)大量計(jì)算資源,對(duì)于手機(jī)這樣的移動(dòng)智能終端來(lái)說(shuō),SoC芯片的算力是遠(yuǎn)遠(yuǎn)達(dá)不到數(shù)據(jù)中心萬(wàn)卡集群的規(guī)模的,怎么支撐大模型的端側(cè)運(yùn)算呢?

      就算勉強(qiáng)帶起來(lái)了,大模型占據(jù)過(guò)多的手機(jī)工作內(nèi)存,搶占其他應(yīng)用的資源,會(huì)不會(huì)出現(xiàn)卡頓或快速掉電?

      本地計(jì)算不足,引入云計(jì)算又會(huì)產(chǎn)生很多問(wèn)題,比如大模型在云上分析處理個(gè)人數(shù)據(jù),會(huì)不會(huì)暴露我的隱私啊?

      要在端側(cè)部署,手機(jī)和大模型都要進(jìn)行一番改造。

      首先,模型層。

      目前主要有兩條路線。

      一是把大模型做小,也就是在端側(cè)引入輕量級(jí)大模型,通過(guò)量化、剪枝、蒸餾等壓縮技術(shù),調(diào)整模型結(jié)構(gòu)和參數(shù)大小,以適配端側(cè)芯片的內(nèi)存和算力特點(diǎn),沒(méi)網(wǎng)也能用,以榮耀、小米為代表。

      榮耀Magic6搭載的,是自研的7B端側(cè)AI大模型(即70億參數(shù)規(guī)模),雷軍在2023年度演講宣布“小米全面擁抱大模型”,主攻的是輕量化和本地部署,目前訓(xùn)練出1.3B和6B參數(shù)規(guī)模的大模型。

      二是把大模型做多,提供不同參數(shù)量級(jí)的大模型,來(lái)支撐不同場(chǎng)景、不同任務(wù),云端協(xié)同,以vivo、OPPO為代表。

      11月vivo發(fā)布的自研AI大模型矩陣,其中包括十億、百億、千億三個(gè)不同參數(shù)量級(jí)的5款大模型。其中,10億量級(jí)模型是主要面向端側(cè)場(chǎng)景打造的專(zhuān)業(yè)文本大模型,70億模型是面向手機(jī)打造的端云兩用模型,700億模型是面向云端服務(wù)的主力模型。

      同樣采用矩陣方式的,還有OPPO的安第斯大模型(AndesGPT),包括從10億至千億多種不同參數(shù)規(guī)模的模型。

      我在VDC大會(huì),實(shí)地體驗(yàn)了基于藍(lán)心大模型的“vivo看見(jiàn)”,可以在完全沒(méi)有網(wǎng)絡(luò)的情況下,為視障群體提供物品實(shí)時(shí)識(shí)別,辨認(rèn)出植物、二維碼、公交卡等物體,響應(yīng)很及時(shí),手機(jī)的發(fā)熱和續(xù)航也在可接受范圍內(nèi),確實(shí)能解決視障群體出行在外時(shí)感知外界環(huán)境的實(shí)際需求。

      這個(gè)功能讓我很受觸動(dòng),還特地發(fā)了條朋友圈分享。

      不過(guò),產(chǎn)品人員也直言,這種完全斷網(wǎng)、本地計(jì)算的大模型應(yīng)用,對(duì)手機(jī)芯片的性能要求很高,目前只能在部分旗艦機(jī)型上落地。

    圖片

      其次,芯片層。

      大模型再小,也是“大”模型,一味壓縮可能會(huì)降低模型性能和輸出質(zhì)量,導(dǎo)致識(shí)別精準(zhǔn)度、生成內(nèi)容下降。所以,大模型落地,硬件的升級(jí),尤其是手機(jī)移動(dòng)芯片,是必不可少的先決條件。

      根據(jù)目前得到的信息,vivo和聯(lián)發(fā)科、高通等都有聯(lián)合研發(fā)合作,來(lái)加速優(yōu)化手機(jī)端側(cè)的AI推理性能,小米也透露,再跟芯片公司(高通和聯(lián)發(fā)科)共同推動(dòng)端側(cè)大模型的落地。此外,今年麒麟芯片回歸,與華為鴻蒙操作系統(tǒng)、盤(pán)古大模型可以實(shí)現(xiàn)深度的協(xié)同優(yōu)化。

      必須承認(rèn),大模型應(yīng)用才剛剛開(kāi)始,與移動(dòng)芯片的協(xié)同調(diào)校也才邁出了第一步,未來(lái)手機(jī)要承載視頻、圖像類(lèi)AIGC任務(wù),絕大多數(shù)用戶應(yīng)該是都不愿意上傳到云端的,所以本地AI計(jì)算硬件的優(yōu)化調(diào)校,接下來(lái)會(huì)是手機(jī)廠商的競(jìng)爭(zhēng)力之一。

      然后,系統(tǒng)層。

      最終,高效可用的大模型應(yīng)用,一定是端云協(xié)同的,來(lái)兼顧體驗(yàn)與隱私。這就帶來(lái)了一些問(wèn)題,比如數(shù)據(jù)和業(yè)務(wù)上云,如何保障用戶的隱私和數(shù)據(jù)安全?基于大模型的AI應(yīng)用,是否會(huì)影響手機(jī)性能、續(xù)航等使用感?要解決這個(gè)問(wèn)題,必須從底層操作系統(tǒng)上下功夫。

      其中,華為旗艦手機(jī)通過(guò)HarmonyOS4系統(tǒng)接入盤(pán)古大模型,鴻蒙系統(tǒng)作為底層源代碼全部自己寫(xiě)出來(lái)的OS,加上微內(nèi)核架構(gòu),將核心的操作系統(tǒng)服務(wù)和安全服務(wù)分離,以及安全芯片和隔離技術(shù),從軟硬件全方位的安全保障機(jī)制。

      此外,OPPO的ColorOS,小米澎湃OS,vivo藍(lán)心大模型與其手機(jī)系統(tǒng)OriginOS4,也都成為自研大模型的落地土壤。

      而大模型能否與操作系統(tǒng)深度融合,以及操作系統(tǒng)自身的流暢、安全、智能,決定了大模型后續(xù)表現(xiàn)的關(guān)鍵。

      據(jù)vivo的一位工作人員分享,除了基座模型本身的性能質(zhì)量之外,大量的工程化細(xì)節(jié)也是必不可少的。要讓操作系統(tǒng)快速執(zhí)行用戶的指令,不僅需要大模型對(duì)輸入的語(yǔ)音/文本,通過(guò)思維鏈進(jìn)行目標(biāo)拆解,而且需要大模型深入理解手機(jī)技能,對(duì)幾百個(gè)技能進(jìn)行智能編排,自動(dòng)選擇和調(diào)用相應(yīng)的API,這樣才能自動(dòng)執(zhí)行復(fù)雜任務(wù),把復(fù)雜留給自己,把簡(jiǎn)單交給用戶。

      不難看出,底層模型、芯片、操作系統(tǒng),是大模型端側(cè)部署,必不可少的三座基礎(chǔ)設(shè)施。同時(shí)也應(yīng)該看到,下一階段的手機(jī)市場(chǎng),是高技術(shù)、高難度、高投入、高風(fēng)險(xiǎn)的,需要扎扎實(shí)實(shí)的“硬功夫”,競(jìng)爭(zhēng)將變得嚴(yán)酷,玩家也會(huì)變得更少。

      第二步

      觸達(dá)用戶,一個(gè)入口

      大模型火了一整年,大廠、媒體和創(chuàng)業(yè)者心心念念的超越ChatGPT、對(duì)標(biāo)GPT4,到了普通讀者那里,似乎還是不明就里:大模型究竟怎么改變我的生活呢?

      那么,把智能手機(jī)變成“阿拉丁神燈”怎么樣?

      看過(guò)童話故事的讀者知道,燈中乾坤大,藏著無(wú)數(shù)資源和寶藏,但不需要阿拉丁費(fèi)心琢磨,他只需要說(shuō)出愿望,都有“燈神”為他將一切事務(wù)安排妥當(dāng)。大模型的理解、創(chuàng)造能力,賦能給手機(jī)語(yǔ)音助手,就將它們變成了一個(gè)個(gè)“燈神”。

      接入大模型能力的語(yǔ)音助手,是手機(jī)廠商觸達(dá)用戶的直接路徑。

      目前來(lái)看,大模型到手機(jī),就干三件事:一是利用大語(yǔ)言模型的自然對(duì)話能力,改變終端交互體驗(yàn);二是利用大模型的理解能力,提供個(gè)性化的服務(wù),熟悉用戶的日常偏好、習(xí)慣,更懂用戶;三是借助大模型的創(chuàng)造能力,進(jìn)行摘要提取、文案生成、圖像制作,提高生產(chǎn)力……

      而上述能力,基本都是通過(guò)語(yǔ)音助手來(lái)一步直達(dá)的。

      比如華為的智慧助手小藝,接入盤(pán)古大模型的底層能力,在智慧交互、高效生產(chǎn)力提升和個(gè)性化服務(wù)三個(gè)方向上獲得增強(qiáng)。

      vivo藍(lán)心大模型與手機(jī)系統(tǒng)OriginOS4結(jié)合,打造了首款全局智能輔助“藍(lán)心小V”,可以通過(guò)自然交流,幫用戶完成很多復(fù)雜任務(wù),化繁為簡(jiǎn)。

      基于OPPO安第斯大模型的新小布助手,以及升級(jí)了小米AI大模型的小愛(ài)同學(xué),也都上線了測(cè)試版、體驗(yàn)版。

      萬(wàn)物智聯(lián)時(shí)代,智能終端用戶會(huì)面臨設(shè)備大爆炸、信息大爆炸、服務(wù)大爆炸,如果一切都需要用戶自己進(jìn)行查找,猶如大海撈針,這對(duì)每一個(gè)人的耐心、時(shí)間、數(shù)字信息素養(yǎng)等,都提出了很高的要求。而大模型與智能助手的融合,就是解藥。

      智能助手可以調(diào)度手機(jī)、耳機(jī)、汽車(chē)、平板、智慧屏、電腦PC、智能家居等物聯(lián)網(wǎng)設(shè)備,是用戶和AIoT之間的最短路徑。

      而依靠大模型的加持,智能助手的分析理解能力、知識(shí)水平、記憶水平、生成能力,都大大得到了提升,讓手機(jī)廠商說(shuō)了多年的“千人千機(jī)”真的可實(shí)現(xiàn)、可感知。

      但很長(zhǎng)一段時(shí)間以來(lái),用戶并沒(méi)有覺(jué)得智能助手是不可或缺的,有的人還會(huì)覺(jué)得跟智能助手對(duì)話很尷尬、人工智障等,甚至覺(jué)得有點(diǎn)雞肋。

      毫不夸張地說(shuō),大模型好不好用,普通用戶不一定關(guān)心,但智能助手好不好用,一句對(duì)話就能試出差距,將是接下來(lái)手機(jī)廠商的競(jìng)爭(zhēng)焦點(diǎn)。

      總結(jié)一下,僅有大模型還不夠,智能助手才是觸達(dá)用戶的最短路徑,也是手機(jī)廠商的必爭(zhēng)之地。

      第三步

      應(yīng)用繁榮,一群開(kāi)發(fā)者

      在手機(jī)和用戶已經(jīng)具備了接入大模型的前提條件之后,下一步就是如何讓開(kāi)發(fā)者真正走入大模型的世界。

      今天,在華為、vivo、OPPO等廠商的發(fā)布會(huì)上,我看到的基于大模型的AI應(yīng)用已經(jīng)不少,但都偏向于示范,比如自然語(yǔ)言的智慧搜索、一句話生成圖像、AI作曲等。這些功能對(duì)于大眾用戶來(lái)說(shuō),還是太過(guò)于基礎(chǔ)了。

      就拿火爆的AIGC應(yīng)用來(lái)說(shuō),生成最美證件照、為寵物作畫(huà)、制作漫畫(huà)頭像、寫(xiě)一段小紅薯分享文案、賽博菩薩、拍圖做數(shù)學(xué)題、生成智能手表壁紙……都是需求極為細(xì)分的。手機(jī)廠商不能,也不應(yīng)該,將這些AI應(yīng)用都全部自己干了,這就必須引入千千萬(wàn)萬(wàn)開(kāi)發(fā)者,去發(fā)揮創(chuàng)意,去基于大模型做無(wú)數(shù)小而美的AI應(yīng)用。

      但是,從開(kāi)發(fā)端到市場(chǎng)端,大模型AI應(yīng)用的路看似很有誘惑力,但對(duì)于開(kāi)發(fā)者來(lái)說(shuō),還是面臨著技術(shù)、學(xué)習(xí)成本、市場(chǎng)壓力等各種顧慮,需要廠商強(qiáng)有力的技術(shù)體系、工具平臺(tái)、賦能方案以及商業(yè)勢(shì)能的加持。

      目前,我們能看到幾種生態(tài)策略:

      鴻蒙的技術(shù)之路。為全場(chǎng)景智慧的市場(chǎng)空間,以及鴻蒙分布式系統(tǒng)的產(chǎn)業(yè)容納能力,對(duì)開(kāi)發(fā)者的吸引力還是很大的。華為已經(jīng)準(zhǔn)備開(kāi)啟全新的HarmonyOS NEXT,全面啟動(dòng)鴻蒙原生應(yīng)用。

      vivo的開(kāi)源之路。Vivo走上了一條開(kāi)源共建之路,70億藍(lán)心大模型成為業(yè)界首個(gè)中文開(kāi)源大模型,開(kāi)源的好處是可以吸引群體智慧,更適合在技術(shù)探索期,進(jìn)行廣泛、不設(shè)邊界的探索,從而催生出更多更新更好的創(chuàng)意應(yīng)用。vivo也發(fā)布了對(duì)應(yīng)的微調(diào)框架以及大模型開(kāi)發(fā)套件BlueKit,為開(kāi)發(fā)者提供全方位的支持。

      OPPO的伙伴之路。此前OPPO公布了2023OPPO開(kāi)發(fā)者大會(huì)的內(nèi)容前瞻,其中潘塔納爾系統(tǒng)能力向開(kāi)發(fā)者全面開(kāi)放,支持一次開(kāi)發(fā)、多形態(tài)多模態(tài)多入口的快速適配,并提供相應(yīng)的工具資源,幫助開(kāi)發(fā)者快速接入泛在服務(wù),吸引更多合作伙伴來(lái)提供多元化的智能服務(wù)。

      可以肯定,接下來(lái)大模型越來(lái)越多、手機(jī)基礎(chǔ)軟硬件逐步成熟、平臺(tái)能力工具接口更加完善,基于大模型的移動(dòng)AI應(yīng)用會(huì)變得越來(lái)越普及,這時(shí)候各家應(yīng)用生態(tài)能拉開(kāi)差距的,就只有開(kāi)發(fā)者的數(shù)量和質(zhì)量——開(kāi)發(fā)者能釋放出多少精彩的想象力,手機(jī)的使用價(jià)值就有多大。

      開(kāi)發(fā)者生態(tài),是移動(dòng)互聯(lián)時(shí)代的護(hù)城河,這一定律在AI大模型時(shí)代也同樣適用。

      對(duì)于手機(jī)廠商來(lái)說(shuō),幸運(yùn)的是,大模型手機(jī)才剛剛開(kāi)始,應(yīng)用開(kāi)發(fā)者不希望錯(cuò)過(guò)機(jī)遇窗口,還有時(shí)間積攢籌碼。

      總結(jié)一下,2023是大模型手機(jī)的修煉之年,三座基建、一個(gè)入口、一群人,都逐漸匯聚在端側(cè),變化或許在瞬息之間。

      當(dāng)大模型的殺手級(jí)應(yīng)用步入手機(jī),讓用戶發(fā)出“哇”的尖叫。這個(gè)大模型手機(jī)的“aha時(shí)刻”,說(shuō)明移動(dòng)互聯(lián)網(wǎng)的下一個(gè)春天,真的來(lái)臨了。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類(lèi)目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專(zhuān)題論壇在沈陽(yáng)成功舉辦。