拼多多解開了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資植物生長(zhǎng)好幫手:廣明源金線蓮組培燈照亮生長(zhǎng)每一步ROG純白系列DIY好物:簡(jiǎn)約不失高雅,買它準(zhǔn)沒錯(cuò)!穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過DCI認(rèn)證并投入市場(chǎng)安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎(jiǎng)電動(dòng)自行車強(qiáng)制性“國(guó)標(biāo)”再修訂,綠源電動(dòng)車以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對(duì)承壓的小家電市場(chǎng),小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營(yíng)收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來激光電視主機(jī)僅有iPad大小2024年冷年空調(diào)市場(chǎng)總結(jié):規(guī)模下探,結(jié)構(gòu)降級(jí),空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學(xué)能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀(jì)念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動(dòng)能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機(jī)型蓄勢(shì)待發(fā)云天勵(lì)飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革
  • 首頁 > 云計(jì)算頻道 > 大模型

    AI大模型會(huì)如何顛覆手機(jī)?

    2023年07月24日 09:33:15   來源:阿爾法工場(chǎng)研究院公眾號(hào)

      本文來自于微信公眾號(hào) 阿爾法工場(chǎng)研究院(ID:alpworks),作者:舉大名耳,授權(quán)站長(zhǎng)之家轉(zhuǎn)載發(fā)布。

      將大模型變小,再塞進(jìn)手機(jī),會(huì)給人們的生活帶來怎樣的影響?

      最近,榮耀成為了國(guó)內(nèi)率先的破局者。

      7月12日,榮耀了發(fā)布一款“革命性”的大模型手機(jī)Magic V2。成為全球首個(gè)實(shí)現(xiàn)大模型與手機(jī)系統(tǒng)融合的廠商。

      在榮耀的宣傳中,更加個(gè)性化、更注重隱私,并且具備多模態(tài)功能的大模型,將會(huì)給用戶帶來全新的體驗(yàn)。

      實(shí)際上,不只是榮耀,身為手機(jī)芯片龍頭企業(yè)的高通,也在近期發(fā)布了自身的大模型。

      在7月初召開的上海WAIC上,人們看到搭載高通第二代驍龍8芯片的安卓手機(jī)直接運(yùn)行參數(shù)規(guī)模超過10億的Stable Diffusion,且只需要15秒左右就可以出圖。

      更重要的是,這樣的運(yùn)行,是完全本地化的,只依賴手機(jī)本身的算力。

      從GPT-3.5到GPT-4.0,曾經(jīng)需要高昂算力,或者只能跑在云端的AI大模型,也開始在智能終端設(shè)備中落地。

      不過,在興奮之余,冷靜的人總不免會(huì)問:我真的需要一個(gè)在部署在手機(jī)大模型么?還是說這只是手機(jī)廠商為挽救疲軟的市場(chǎng)而制造的噱頭?

      打破APP的壁壘

      在人們討論“大模型手機(jī)”之前,一個(gè)不可忽略的事實(shí)是:當(dāng)今的各類大模型AI,如chatGPT、新必應(yīng)等,實(shí)際上早已推出了各自的手機(jī)版APP。

      通過這一個(gè)個(gè)APP,在手機(jī)上運(yùn)行大模型,早已不是什么難事,且與本地部署的方式相比,這些調(diào)用云端算力的APP,并不會(huì)對(duì)手機(jī)配置造成額外負(fù)擔(dān)。

      那既然如此,那人們?yōu)槭裁催要費(fèi)盡心機(jī)地開發(fā)一個(gè)專用的“手機(jī)版”大模型呢?

      對(duì)于這個(gè)問題,谷歌之前的做法似乎給出了一個(gè)可能的答案。

      今年5月,在ChatGPT3.5發(fā)布半年后,Google終于公布了全新一代大語言模型PaLM2,用以對(duì)抗ChatGPT。作為一種差異化競(jìng)爭(zhēng),PaLM2可以被部署在智能手機(jī)上。

      當(dāng)時(shí),PaLM2包含四個(gè)大模型,按照參數(shù)規(guī)模從大到小,分別命名為:獨(dú)角獸(Unicorn)、野牛(Bison)、水獺(Otter)和壁虎(Gecko)。

      只有參數(shù)最小的“壁虎”可以在手機(jī)上運(yùn)行,Google稱,它的運(yùn)行速度足夠快,不聯(lián)網(wǎng)也能正常工作。

      但問題是:人們?yōu)槭裁匆誀奚鼌?shù)、性能為代價(jià),在手機(jī)上使用這樣一個(gè)“縮水版”的小模型呢?

      一個(gè)最重要的原因是:與那些以APP形態(tài)出現(xiàn)在手機(jī)上的大模型相比,一個(gè)融入手機(jī)系統(tǒng)中的大模型,可以打破各應(yīng)用之間的壁壘,讓其他App也自帶大模型特性。

      例如,融入手機(jī)中壁虎(Gecko),可以通過Gmail,實(shí)現(xiàn)自動(dòng)寫郵件的功能。

      用戶只需在Gmail的“Help me write”(幫我寫)中輸入需求,它就會(huì)結(jié)合此前郵件中的信息,寫出完整的郵件。

      通過這樣與手機(jī)系統(tǒng)深入融合的大模型,人們不僅可以實(shí)現(xiàn)AI對(duì)各類APP的賦能,甚至還能將大模型作為通用接口,像“膠水”一樣,將各類APP的能力實(shí)現(xiàn)組合,實(shí)現(xiàn)更多具有想象力的擴(kuò)展。

      例如,倘若人們?cè)谝粋(gè)陌生的地點(diǎn)出行,想尋找某個(gè)罕見、偏僻,在地圖上并不顯眼的位置,這時(shí),手機(jī)上的大模型,就可以調(diào)用語音+識(shí)圖+導(dǎo)航的多模態(tài)功能,十分接地氣地告訴你:“在前面的蘭州拉面往左拐,看到城市便捷酒店后再右拐300米”,而不是簡(jiǎn)單地說出“直行”、“右拐”等機(jī)械的回答。

      然而,要實(shí)現(xiàn)這樣的組合,一個(gè)難以繞開的問題,就是算力。

      同樣的,開始在手機(jī)上部署大模型的高通,也意識(shí)到了這個(gè)問題。在高通日前發(fā)布的《混合AI是AI的未來》技術(shù)白皮書中,首次提出了混合AI架構(gòu)的概念。

      而這一概念,簡(jiǎn)而言之,就是讓AI能夠在云端和終端側(cè)進(jìn)行分布式處理,并根據(jù)不同的模型和需求靈活分配負(fù)載。

      改造現(xiàn)實(shí)的肢體

      也許有人認(rèn)為,與在手機(jī)上部署大模型的做法相比,在云端進(jìn)行計(jì)算的方法,才是既省力又劃算的。

      然而,實(shí)際上隨著日活用戶數(shù)量及其使用頻率的增長(zhǎng),云端推理的成本會(huì)顯著增加,而這樣的高成本,也會(huì)讓生成式AI的規(guī);瘮U(kuò)展陷入瓶頸。

      畢竟,單個(gè)AI超算的服務(wù)器帶寬,以及消耗的電力,終歸是有上限的,而用戶的增長(zhǎng)卻并沒有一個(gè)固定的上限。

      這就是為什么混合AI架構(gòu),即在云端和終端側(cè)進(jìn)行分布式處理的AI,會(huì)成為AI的未來趨勢(shì),因?yàn)樗軌蚶媒K端側(cè)的計(jì)算能力,降低云端推理的依賴和成本。

      而在混合A架構(gòu)的基礎(chǔ)上,高通還提到,為實(shí)現(xiàn)生成式AI的規(guī);瘮U(kuò)展,AI處理的重心正在向邊緣轉(zhuǎn)移。

      也就是說,將來會(huì)有越來越多的AI數(shù)據(jù),會(huì)在手機(jī)、攝像頭、傳感器等終端側(cè)進(jìn)行處理。

      那這對(duì)大模型的發(fā)展來說意味著什么?

      截至目前為止,大部分大模型所能處理的任務(wù),仍舊停留在文字生成、繪制圖片、編寫代碼這些工作上。

      這樣的任務(wù),本質(zhì)上都是屬于出不了辦公室的“案頭工作”。

      而AI如果要真正地走進(jìn)社會(huì),為更多的行業(yè)、群體帶來改變,而不僅僅是一個(gè)存在于網(wǎng)頁中的“秘書”,那它就必須具有改造現(xiàn)實(shí)世界的“肢體”。

      而這樣的“肢體”,正是一個(gè)個(gè)嵌入各個(gè)行業(yè)的邊緣端設(shè)備。

      舉例來說,在醫(yī)療領(lǐng)域,AI可以通過智能攝像頭,評(píng)估帕金森患者的狀態(tài);

      在工業(yè)行業(yè),邊緣化的AI可以提高生產(chǎn)過程的智能化和自動(dòng)化,高效地完成零部件瑕疵檢測(cè)等任務(wù)。

      在農(nóng)業(yè)領(lǐng)域,邊緣化的AI可以通過智能傳感器或無人機(jī),實(shí)現(xiàn)對(duì)農(nóng)作物的精準(zhǔn)種植和管理,如實(shí)現(xiàn)農(nóng)業(yè)病蟲害識(shí)別、農(nóng)作物品質(zhì)評(píng)估等任務(wù)。

      所有這一切,都是僅存在于網(wǎng)頁中的大模型所無法完成的。

      也正因如此,大模型“邊緣化”所帶來的顯著后果,就是AI橫向應(yīng)用范圍的極大擴(kuò)展。

      如何讓GPT助力農(nóng)業(yè),已經(jīng)成為人們思考的方向之一

      而隨著邊緣化的到來,聯(lián)邦計(jì)算等與之匹配的模型訓(xùn)練方式,也將打破原本數(shù)據(jù)中心化的格局。

      因?yàn)榈搅四菚r(shí),數(shù)據(jù)并不總是在某一個(gè)云端服務(wù)器完成計(jì)算,而是由多個(gè)參與方在本地訓(xùn)練機(jī)器學(xué)習(xí)模型,之后再將模型參數(shù)或梯度上傳到中心服務(wù)器進(jìn)行聚合。

      但詭異的是,依據(jù)科技行業(yè)發(fā)展的邏輯,這樣一種去中心化的、可以實(shí)現(xiàn)跨行業(yè)或跨領(lǐng)域數(shù)據(jù)共享的技術(shù),非但不會(huì)弱化原有的壟斷行為,甚至還會(huì)進(jìn)一步將其強(qiáng)化。

      新巨頭的崛起

      在前網(wǎng)絡(luò)時(shí)代,人們認(rèn)為個(gè)人網(wǎng)站可以消解大傳統(tǒng)媒體的信息壟斷,但后來互聯(lián)網(wǎng)霸主的規(guī)模,早已傳統(tǒng)媒體的市值的天花板。

      如果將這些科技巨頭的市值,換算成國(guó)家的GDP,那么在2022年,微軟的市值就超過了五常之一的俄羅斯(1.7萬億),全球能與之匹敵的經(jīng)濟(jì)體屈指可數(shù)。

      究其原因,是因?yàn)槿魏?ldquo;技術(shù)平權(quán)”的進(jìn)行,在讓科技變得更加低廉化、平民化的同時(shí),都會(huì)反向地催生出一批技術(shù)壁壘更高,集中性更強(qiáng)的超級(jí)巨頭。

      因?yàn)檎怯辛诉@些“高壁壘”的技術(shù)進(jìn)行支撐,巨頭們的規(guī)模擴(kuò)張才成為可能。

      例如Meta正是通過一系列數(shù)據(jù)、算法的優(yōu)勢(shì),才能對(duì)眾多用戶投其所好,并構(gòu)筑了Facebook和Twitter等龐大的社交帝國(guó)。

      而英偉達(dá)也正是通過自身核心的GPU技術(shù),和壁壘頗高的CUDA生態(tài),才讓今天的大模型得以完成海量的計(jì)算,才得以讓AI成為人人觸手可及的技術(shù)。

      而同樣的,當(dāng)混合計(jì)算的AI,通過云端與終端側(cè)相結(jié)合的方式,降低了大模型的推理的成本后,其造成的“技術(shù)平權(quán)”,至少會(huì)造就兩個(gè)方向上的巨頭。

      其一,就是邊緣化芯片的提供者。

      因?yàn)樾酒瑢拥腁I運(yùn)算處理能力,是AI落地終端的必要條件。

      雖然在邊緣化時(shí)代,AI的算力場(chǎng)景是多樣化的,例如工業(yè)、醫(yī)療、娛樂等,但其中最重要的“七寸”,仍然是在用戶量最多的手機(jī)端。

      誰若是能圍繞手機(jī)端的大模型,形成一套從設(shè)計(jì)、生產(chǎn)、到軟件生態(tài)一體化的完整體系,誰就將成為新一代的巨頭。

      在這方面,身為行業(yè)龍頭的高通,早已開始了提前布局。

      目前,搭載驍龍平臺(tái)的已發(fā)布XR終端已經(jīng)超過65款,其中Meta、PICO等頭部廠商的旗艦產(chǎn)品均采用的是高通芯片。

      第二個(gè)方向的巨頭,就是能為行業(yè)提供全套解決方案的玩家。

      畢竟AI在終端側(cè)的落地,需要的不僅是硬件,還有軟件端的優(yōu)化。

      在同樣的硬件基礎(chǔ)上,誰的AI引擎能比其他競(jìng)品具有更高的效能,能更快地完成計(jì)算,誰就將在軟件棧方面更具優(yōu)勢(shì)。

      而要想實(shí)現(xiàn)這點(diǎn),就必須在大模型的量化、壓縮、條件計(jì)算、神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索和編譯方面進(jìn)行突破,在不犧牲太多精度的前提下對(duì)AI模型進(jìn)行縮減。

      因此,誰能在大模型的壓縮、小型化技術(shù)上取得突破,誰就能率先構(gòu)建起自身基于終端的軟件生態(tài)。

      綜上所述,大模型在手機(jī)端的落地,不僅僅是AI真正具備“肢體”,進(jìn)入人類生活的開始,也是行業(yè)發(fā)生顛覆,新老巨頭進(jìn)行更替的時(shí)刻。

      在這樣的時(shí)代,變革的風(fēng)暴遠(yuǎn)比我們想象的要猛烈。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。