行業(yè)唯一!海爾熱聲熱泵技術獲全國顛覆性技術創(chuàng)新大賽最高獎OPPO A5 Pro首創(chuàng)獵手天線架構:信號能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡體驗電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應,強者恒強?——《中國企業(yè)科創(chuàng)力研究報告(2024)》美團年度報告竟然用上了AI和短。窟@下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級自動泊車/接駕等多項功能華為官方翻新手機最高降價4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內(nèi)置自研W-Fi芯片李斌回應螢火蟲外觀設計:看過實車的人都喜歡這個設計林杰:未來 A 級、A0 級、A00 級車型都將是領克純電的“主場”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設與智慧出行萬象分區(qū)、絢彩XDR、量子點Pro 2025齊出手,TCL引領觀影體驗新變革!QQ音樂年度聽歌報告發(fā)布:誰是你最喜歡的歌手?OpenAI正式發(fā)布o3 - 通往AGI的路上,已經(jīng)沒有了任何阻礙「送禮物」難撬動社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁技術報告出爐2024年結束,哪里是原創(chuàng)動畫的應許之地?
  • 首頁 > 云計算頻道 > 大模型

    AI大模型會如何顛覆手機?

    2023年07月24日 09:33:15   來源:阿爾法工場研究院公眾號

      本文來自于微信公眾號 阿爾法工場研究院(ID:alpworks),作者:舉大名耳,授權站長之家轉載發(fā)布。

      將大模型變小,再塞進手機,會給人們的生活帶來怎樣的影響?

      最近,榮耀成為了國內(nèi)率先的破局者。

      7月12日,榮耀了發(fā)布一款“革命性”的大模型手機Magic V2。成為全球首個實現(xiàn)大模型與手機系統(tǒng)融合的廠商。

      在榮耀的宣傳中,更加個性化、更注重隱私,并且具備多模態(tài)功能的大模型,將會給用戶帶來全新的體驗。

      實際上,不只是榮耀,身為手機芯片龍頭企業(yè)的高通,也在近期發(fā)布了自身的大模型。

      在7月初召開的上海WAIC上,人們看到搭載高通第二代驍龍8芯片的安卓手機直接運行參數(shù)規(guī)模超過10億的Stable Diffusion,且只需要15秒左右就可以出圖。

      更重要的是,這樣的運行,是完全本地化的,只依賴手機本身的算力。

      從GPT-3.5到GPT-4.0,曾經(jīng)需要高昂算力,或者只能跑在云端的AI大模型,也開始在智能終端設備中落地。

      不過,在興奮之余,冷靜的人總不免會問:我真的需要一個在部署在手機大模型么?還是說這只是手機廠商為挽救疲軟的市場而制造的噱頭?

      打破APP的壁壘

      在人們討論“大模型手機”之前,一個不可忽略的事實是:當今的各類大模型AI,如chatGPT、新必應等,實際上早已推出了各自的手機版APP。

      通過這一個個APP,在手機上運行大模型,早已不是什么難事,且與本地部署的方式相比,這些調用云端算力的APP,并不會對手機配置造成額外負擔。

      那既然如此,那人們?yōu)槭裁催要費盡心機地開發(fā)一個專用的“手機版”大模型呢?

      對于這個問題,谷歌之前的做法似乎給出了一個可能的答案。

      今年5月,在ChatGPT3.5發(fā)布半年后,Google終于公布了全新一代大語言模型PaLM2,用以對抗ChatGPT。作為一種差異化競爭,PaLM2可以被部署在智能手機上。

      當時,PaLM2包含四個大模型,按照參數(shù)規(guī)模從大到小,分別命名為:獨角獸(Unicorn)、野牛(Bison)、水獺(Otter)和壁虎(Gecko)。

      只有參數(shù)最小的“壁虎”可以在手機上運行,Google稱,它的運行速度足夠快,不聯(lián)網(wǎng)也能正常工作。

      但問題是:人們?yōu)槭裁匆誀奚鼌?shù)、性能為代價,在手機上使用這樣一個“縮水版”的小模型呢?

      一個最重要的原因是:與那些以APP形態(tài)出現(xiàn)在手機上的大模型相比,一個融入手機系統(tǒng)中的大模型,可以打破各應用之間的壁壘,讓其他App也自帶大模型特性。

      例如,融入手機中壁虎(Gecko),可以通過Gmail,實現(xiàn)自動寫郵件的功能。

      用戶只需在Gmail的“Help me write”(幫我寫)中輸入需求,它就會結合此前郵件中的信息,寫出完整的郵件。

      通過這樣與手機系統(tǒng)深入融合的大模型,人們不僅可以實現(xiàn)AI對各類APP的賦能,甚至還能將大模型作為通用接口,像“膠水”一樣,將各類APP的能力實現(xiàn)組合,實現(xiàn)更多具有想象力的擴展。

      例如,倘若人們在一個陌生的地點出行,想尋找某個罕見、偏僻,在地圖上并不顯眼的位置,這時,手機上的大模型,就可以調用語音+識圖+導航的多模態(tài)功能,十分接地氣地告訴你:“在前面的蘭州拉面往左拐,看到城市便捷酒店后再右拐300米”,而不是簡單地說出“直行”、“右拐”等機械的回答。

      然而,要實現(xiàn)這樣的組合,一個難以繞開的問題,就是算力。

      同樣的,開始在手機上部署大模型的高通,也意識到了這個問題。在高通日前發(fā)布的《混合AI是AI的未來》技術白皮書中,首次提出了混合AI架構的概念。

      而這一概念,簡而言之,就是讓AI能夠在云端和終端側進行分布式處理,并根據(jù)不同的模型和需求靈活分配負載。

      改造現(xiàn)實的肢體

      也許有人認為,與在手機上部署大模型的做法相比,在云端進行計算的方法,才是既省力又劃算的。

      然而,實際上隨著日活用戶數(shù)量及其使用頻率的增長,云端推理的成本會顯著增加,而這樣的高成本,也會讓生成式AI的規(guī)模化擴展陷入瓶頸。

      畢竟,單個AI超算的服務器帶寬,以及消耗的電力,終歸是有上限的,而用戶的增長卻并沒有一個固定的上限。

      這就是為什么混合AI架構,即在云端和終端側進行分布式處理的AI,會成為AI的未來趨勢,因為它能夠利用終端側的計算能力,降低云端推理的依賴和成本。

      而在混合A架構的基礎上,高通還提到,為實現(xiàn)生成式AI的規(guī);瘮U展,AI處理的重心正在向邊緣轉移。

      也就是說,將來會有越來越多的AI數(shù)據(jù),會在手機、攝像頭、傳感器等終端側進行處理。

      那這對大模型的發(fā)展來說意味著什么?

      截至目前為止,大部分大模型所能處理的任務,仍舊停留在文字生成、繪制圖片、編寫代碼這些工作上。

      這樣的任務,本質上都是屬于出不了辦公室的“案頭工作”。

      而AI如果要真正地走進社會,為更多的行業(yè)、群體帶來改變,而不僅僅是一個存在于網(wǎng)頁中的“秘書”,那它就必須具有改造現(xiàn)實世界的“肢體”。

      而這樣的“肢體”,正是一個個嵌入各個行業(yè)的邊緣端設備。

      舉例來說,在醫(yī)療領域,AI可以通過智能攝像頭,評估帕金森患者的狀態(tài);

      在工業(yè)行業(yè),邊緣化的AI可以提高生產(chǎn)過程的智能化和自動化,高效地完成零部件瑕疵檢測等任務。

      在農(nóng)業(yè)領域,邊緣化的AI可以通過智能傳感器或無人機,實現(xiàn)對農(nóng)作物的精準種植和管理,如實現(xiàn)農(nóng)業(yè)病蟲害識別、農(nóng)作物品質評估等任務。

      所有這一切,都是僅存在于網(wǎng)頁中的大模型所無法完成的。

      也正因如此,大模型“邊緣化”所帶來的顯著后果,就是AI橫向應用范圍的極大擴展。

      如何讓GPT助力農(nóng)業(yè),已經(jīng)成為人們思考的方向之一

      而隨著邊緣化的到來,聯(lián)邦計算等與之匹配的模型訓練方式,也將打破原本數(shù)據(jù)中心化的格局。

      因為到了那時,數(shù)據(jù)并不總是在某一個云端服務器完成計算,而是由多個參與方在本地訓練機器學習模型,之后再將模型參數(shù)或梯度上傳到中心服務器進行聚合。

      但詭異的是,依據(jù)科技行業(yè)發(fā)展的邏輯,這樣一種去中心化的、可以實現(xiàn)跨行業(yè)或跨領域數(shù)據(jù)共享的技術,非但不會弱化原有的壟斷行為,甚至還會進一步將其強化。

      新巨頭的崛起

      在前網(wǎng)絡時代,人們認為個人網(wǎng)站可以消解大傳統(tǒng)媒體的信息壟斷,但后來互聯(lián)網(wǎng)霸主的規(guī)模,早已傳統(tǒng)媒體的市值的天花板。

      如果將這些科技巨頭的市值,換算成國家的GDP,那么在2022年,微軟的市值就超過了五常之一的俄羅斯(1.7萬億),全球能與之匹敵的經(jīng)濟體屈指可數(shù)。

      究其原因,是因為任何“技術平權”的進行,在讓科技變得更加低廉化、平民化的同時,都會反向地催生出一批技術壁壘更高,集中性更強的超級巨頭。

      因為正是有了這些“高壁壘”的技術進行支撐,巨頭們的規(guī)模擴張才成為可能。

      例如Meta正是通過一系列數(shù)據(jù)、算法的優(yōu)勢,才能對眾多用戶投其所好,并構筑了Facebook和Twitter等龐大的社交帝國。

      而英偉達也正是通過自身核心的GPU技術,和壁壘頗高的CUDA生態(tài),才讓今天的大模型得以完成海量的計算,才得以讓AI成為人人觸手可及的技術。

      而同樣的,當混合計算的AI,通過云端與終端側相結合的方式,降低了大模型的推理的成本后,其造成的“技術平權”,至少會造就兩個方向上的巨頭。

      其一,就是邊緣化芯片的提供者。

      因為芯片層的AI運算處理能力,是AI落地終端的必要條件。

      雖然在邊緣化時代,AI的算力場景是多樣化的,例如工業(yè)、醫(yī)療、娛樂等,但其中最重要的“七寸”,仍然是在用戶量最多的手機端。

      誰若是能圍繞手機端的大模型,形成一套從設計、生產(chǎn)、到軟件生態(tài)一體化的完整體系,誰就將成為新一代的巨頭。

      在這方面,身為行業(yè)龍頭的高通,早已開始了提前布局。

      目前,搭載驍龍平臺的已發(fā)布XR終端已經(jīng)超過65款,其中Meta、PICO等頭部廠商的旗艦產(chǎn)品均采用的是高通芯片。

      第二個方向的巨頭,就是能為行業(yè)提供全套解決方案的玩家。

      畢竟AI在終端側的落地,需要的不僅是硬件,還有軟件端的優(yōu)化。

      在同樣的硬件基礎上,誰的AI引擎能比其他競品具有更高的效能,能更快地完成計算,誰就將在軟件棧方面更具優(yōu)勢。

      而要想實現(xiàn)這點,就必須在大模型的量化、壓縮、條件計算、神經(jīng)網(wǎng)絡架構搜索和編譯方面進行突破,在不犧牲太多精度的前提下對AI模型進行縮減。

      因此,誰能在大模型的壓縮、小型化技術上取得突破,誰就能率先構建起自身基于終端的軟件生態(tài)。

      綜上所述,大模型在手機端的落地,不僅僅是AI真正具備“肢體”,進入人類生活的開始,也是行業(yè)發(fā)生顛覆,新老巨頭進行更替的時刻。

      在這樣的時代,變革的風暴遠比我們想象的要猛烈。

      文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。