" />
正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛(ài)“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個(gè)“0元開(kāi)店”類目,推出多項(xiàng)新商入駐權(quán)益年內(nèi)狂攬五項(xiàng)第一,“字節(jié)系大模型”何以后發(fā)先至?科技云報(bào)到:有韌性才能更“任性”,云韌性構(gòu)筑業(yè)務(wù)最后一道防線阿里云盤出“BUG”客服回應(yīng):已修復(fù)圍剿BBA,比亞迪和騰勢(shì)也準(zhǔn)備出一份力阿里云服務(wù)器操作系統(tǒng)Alibaba Cloud Linux全新升級(jí),核心場(chǎng)景性能提升超20%屏幕面板 10 月出貨,蘋果 M4 MacBook Air 被曝 2025Q1 發(fā)布蘋果史上最大:iPhone 16系列電池容量公布后移動(dòng)互聯(lián)網(wǎng)時(shí)代,移動(dòng)App兼容測(cè)試持續(xù)占據(jù)核心地位歐盟警告蘋果:六個(gè)月內(nèi)開(kāi)放iPhone系統(tǒng) 否則重罰湖北省電子信息產(chǎn)業(yè)前8月實(shí)現(xiàn)營(yíng)收5970億元,同比增長(zhǎng)13.53%傳三星計(jì)劃2025年推出卷軸屏手機(jī)蘋果新專利探索折疊iPhone未來(lái),任意表面實(shí)現(xiàn)觸敏控制蘋果iPhone16/Pro系列手機(jī)今日首銷,5999~9999元起各方媒體的聚焦關(guān)注,中南高科實(shí)力呈現(xiàn)高科“新質(zhì)”表現(xiàn)力拼多多解開(kāi)了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    蘋果大模型,不藏了

    2024年01月08日 12:00:27   來(lái)源:AI藍(lán)媒匯

      歲末年初,蘋果加快了在大模型領(lǐng)域的步伐。

      上個(gè)月,蘋果先是推出了名為Ferret的多模態(tài)大語(yǔ)言模型,圖像處理技術(shù)堪稱驚艷;而后又發(fā)布了一篇題為《閃存中的大型語(yǔ)言模型:在有限內(nèi)存下高效的大型語(yǔ)言模型推理》的論文,直指大模型落地iPhone等“內(nèi)存有限”設(shè)備的方法。

      進(jìn)入新年,Siri助手將搭載生成式模型Ajax的消息,再次不脛而走。

      去年六月和九月的兩次重要發(fā)布會(huì),蘋果分別掏出了早有傳聞的XR項(xiàng)目和iPhone系列的慣例年更,前者市場(chǎng)反響平平,后者擠牙膏被批像是被“卡脖子”了,硅谷All in大模型之時(shí),蘋果官方對(duì)人工智能這一年度熱詞始終閉口不談。

      公司CEO庫(kù)克曾解釋道,蘋果有計(jì)劃在更多產(chǎn)品中加入AI,但要“深思熟慮”。

      現(xiàn)如今,也許是想好了,也許是技術(shù)突破了,留了一手的蘋果,終于不藏了。

      iPhone的AI時(shí)刻,來(lái)了?

      Siri助手AI化其實(shí)早有預(yù)兆:去年七月份,彭博社發(fā)文稱蘋果內(nèi)部正在暗中測(cè)試一款對(duì)標(biāo)OpenAI和谷歌的生成式AI工具,暫定名“Apple GPT”。

      因使用Google JAX框架進(jìn)行構(gòu)建,Apple GPT的開(kāi)發(fā)框架被命名為Ajax。

      當(dāng)時(shí)的消息稱,蘋果LLM技術(shù)的最大用武之地,便是整合在Siri內(nèi)部,讓語(yǔ)音助手以更為智能的方式協(xié)助用戶。

      現(xiàn)在,更多細(xì)節(jié)被透露——蘋果發(fā)布的論文稱,這項(xiàng)將大語(yǔ)言模型放在閃存中優(yōu)化運(yùn)行的技術(shù),較傳統(tǒng)運(yùn)行方法提高了4-5倍(CPU)和20-25倍(GPU)的推理速度。

      把大象(大模型)裝進(jìn)冰箱(手機(jī))里的方法,來(lái)了:先減少閃存?zhèn)鬏數(shù)臄?shù)據(jù)量,再提高每次傳輸?shù)耐掏铝俊?/p>

      先看框架:以手機(jī)為例,平時(shí)購(gòu)機(jī)時(shí)的【12+256G】、【16+512G】,12/16為運(yùn)行內(nèi)存,256/512為儲(chǔ)存空間。

      以此類推絕大部分移動(dòng)設(shè)備存儲(chǔ)結(jié)構(gòu),運(yùn)存空間小,但讀取速率高(DRAM 10GB/s);儲(chǔ)存空間大,但讀取速率相對(duì)較低(Flash Memory 1GB/s)

      一般來(lái)說(shuō),大模型的推理階段,模型加載、分析數(shù)據(jù)需要直接占用運(yùn)存,而目前主流手機(jī)市場(chǎng)最大的16GB運(yùn)存,也并不能完全滿足大模型所需的空間:模型大小>手機(jī)內(nèi)存。

      蘋果給出的解決方案是“先減少閃存?zhèn)鬏數(shù)臄?shù)據(jù)量”——把大模型完全體放在空間更大的儲(chǔ)存中,運(yùn)行時(shí)只調(diào)用必要數(shù)據(jù)進(jìn)入運(yùn)存。

      這并非一個(gè)簡(jiǎn)單的搬箱子過(guò)程,如何正確篩選出所有必要數(shù)據(jù),以及如何把數(shù)據(jù)快速由閃存?zhèn)鬏數(shù)竭\(yùn)存,是兩個(gè)需要解決的問(wèn)題。

      方法之一被命名為sliding window(滑窗):

      假設(shè)大模型正在處理Once upon a time there was a kid who had a dream這句話,在處理“Once upon a time there”這段字符的時(shí)候,圖中上半部分的青色格子(神經(jīng)元)處于激活狀態(tài);而當(dāng)處理字段變到“upon a time there was”(往后推進(jìn)了一個(gè)字符),圖中下半部新啟用了藍(lán)色格子,并刪除了了此前青色部分的幾個(gè)格子(以粉色標(biāo)注),其余青色保持不變。

      這就是sliding Window的核心思想:查缺補(bǔ)漏,多退少補(bǔ)。在大模型運(yùn)行過(guò)程中,只保留一開(kāi)始就激活的神經(jīng)元,后續(xù)的每次運(yùn)算,都基于前一次參數(shù)進(jìn)行刪除和添加,省去了一部分重復(fù)工作。

      當(dāng)然,這種預(yù)設(shè)也并非沒(méi)有問(wèn)題,知乎博主@Civ發(fā)文稱,sliding window可用的核心假設(shè)是大模型在處理相鄰數(shù)據(jù)時(shí)前后具有相似性,但這個(gè)相似性蘋果沒(méi)有展開(kāi)論證。

      再者是傳輸:將多次傳輸?shù)臄?shù)據(jù)拼接后一次性讀取,保持連續(xù)完整的“數(shù)據(jù)”,避免多次復(fù)制拖慢時(shí)間;另外,提前預(yù)留出一個(gè)較大的空間(較大,但仍遠(yuǎn)遠(yuǎn)小于模型整體占用),避免在數(shù)據(jù)傳輸過(guò)程中,因多次增加空間而加大設(shè)備的計(jì)算量。

      此前,藍(lán)媒匯在《AI PC發(fā)布,聯(lián)想真的想通AI了嗎?》中提及,限制大模型進(jìn)入移動(dòng)端的瓶頸就是模型占地太大,影響設(shè)備本身正常運(yùn)轉(zhuǎn),或者塞不進(jìn)去導(dǎo)致無(wú)法運(yùn)行。

      蘋果這項(xiàng)新研究的諸多技術(shù)細(xì)節(jié),都在指向空間的壓縮,包括數(shù)據(jù)體量,也包括運(yùn)算所占用的算力。

      發(fā)力多模態(tài)

      之前有個(gè)段子(也可能是真事兒),說(shuō)是大模型搞不定人機(jī)驗(yàn)證,是因?yàn)锳I被設(shè)定不能說(shuō)謊,所以無(wú)法選擇“我不是機(jī)器人”。

      去年十月份,蘋果還是以論文的形式公布了一項(xiàng)研究成果:Ferret大模型,自己搞定谷歌人機(jī)驗(yàn)證了。

      遙遙領(lǐng)先于GPT4。

      不久之前,蘋果公布了更多Ferret模型的細(xì)節(jié)、功能。

      圖/蘋果 Github Ferret模型介紹

      和GPT4相比,F(xiàn)erret的領(lǐng)先之處在于,它不僅能準(zhǔn)確識(shí)別并處理圖像內(nèi)容,還能用算法區(qū)分圖片中各種元素(人、物體等等),并根據(jù)用戶指令找出對(duì)應(yīng)元素。

      這種多模態(tài)理解能力,使得Ferret能夠同時(shí)處理用戶輸入的圖像和自然語(yǔ)言,并且由于其算法能夠?qū)D像中的元素準(zhǔn)確拆分、定位,F(xiàn)erret可以準(zhǔn)確理解如“圖片右上角”、“靠近沙發(fā)”這類指令。

      相比于卷瘋了的自然語(yǔ)言處理,這種基于圖像的交互使得信息更加直觀。

      最近一次更新,蘋果提供了Ferret的7B和13B兩個(gè)版本,并創(chuàng)建了包含了1.1M個(gè)樣本的GRIT的數(shù)據(jù)集以豐富空間知識(shí),進(jìn)一步增強(qiáng)功能。

      考慮到蘋果相當(dāng)成熟的產(chǎn)品生態(tài)以及巨量用戶規(guī)模,AI落地帶來(lái)的換機(jī)潮等收益,或?qū)O為可觀。

      2023年被稱為是AI的iPhone時(shí)刻,現(xiàn)在,蘋果的AI時(shí)刻大約也快到了。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。