蘋果智能家居布局曝光:類 iPad 智能屏幕做先鋒,室內(nèi)攝像頭等打出組合拳北美洲報告的網(wǎng)絡(luò)攻擊發(fā)生率最高字節(jié)社交再變陣:抖音內(nèi)測“朋友圈”、升級朋友功能,停止多閃研發(fā)Oizom推出Pollusense實現(xiàn)空氣質(zhì)量監(jiān)測的革命性突破雙11眾生相:有人出走,有人入局紅魔10 Pro將首發(fā)7050mAh牛魔王電池:不加厚不加重雷軍:小米SU7第10萬臺車下線,僅用時230天北汽藍(lán)谷:與小馬智行達(dá)成L4無人駕駛車型開發(fā)合作,計劃在明年推出首批極狐阿爾法T5 Robotaxi騰訊音樂三季度凈利潤勁升35.3%!付費用戶已達(dá)1.190億蘋果有望明年3月發(fā)布智能家居顯示器 2026年生產(chǎn)智能攝像頭小鵬汽車前智駕負(fù)責(zé)人加入比亞迪 曾深度參與無圖智駕開發(fā)SEMI:2024Q3全球硅晶圓出貨面積同比增長6.8%、環(huán)比增長5.9%告別高價流量,這個雙11變了李彥宏的“少數(shù)派報告”:如何成為AI時代的1%郵件欺詐新威脅,微軟披露 Exchange Server 高風(fēng)險漏洞國家郵政局:11月11日快遞業(yè)務(wù)量7.01億件 創(chuàng)歷年“雙11”當(dāng)日新高AMD宣布推出第二代Versal Premium系列,實現(xiàn)全新系統(tǒng)加速水平,滿足數(shù)據(jù)密集型工作負(fù)載需求別再被尺寸迷惑了!98吋對比100吋完勝,這些細(xì)節(jié)你絕對想不到!拼多多擬更新價格保護規(guī)則,活動商品均適用降價補差AIGC的全新機遇!北京這場專家云集的AIGC國際會議與大模型應(yīng)用峰會即將啟幕
  • 首頁 > 企業(yè)IT頻道 > 軟件即服務(wù)

    ExecuTorch測試版上線,加速Arm平臺邊緣側(cè)生成式AI發(fā)展

    2024年11月05日 10:32:49   來源:Citnews中文科技資訊

      新聞重點:

      · 通過 Arm 計算平臺與 ExecuTorch 框架的結(jié)合,使得更小、更優(yōu)化的模型能夠在邊緣側(cè)運行,加速邊緣側(cè)生成式 AI 的實現(xiàn)

      · 新的 Llama 量化模型適用于基于 Arm 平臺的端側(cè)和邊緣側(cè) AI 應(yīng)用,可減少內(nèi)存占用,提高精度、性能和可移植性

      · 全球 2,000 萬名 Arm 開發(fā)者能夠更迅速地在數(shù)十億臺邊緣側(cè)設(shè)備上大規(guī)模開發(fā)和部署更多的智能 AI 應(yīng)用

      Arm 正在與 Meta 公司的 PyTorch 團隊攜手合作,共同推進(jìn)新的 ExecuTorch 測試版 (Beta) 上線,旨在為全球數(shù)十億邊緣側(cè)設(shè)備和數(shù)百萬開發(fā)者提供人工智能 (AI) 和機器學(xué)習(xí) (ML) 功能,進(jìn)而確保 AI 真正的潛力能被最廣泛的設(shè)備和開發(fā)者所使用。

      借助 ExecuTorch 和新的 Llama 量化模型,Arm 計算平臺優(yōu)化生成式 AI 性能

      Arm 計算平臺無處不在,為全球眾多邊緣側(cè)設(shè)備提供支持,而 ExecuTorch 則是專為移動和邊緣側(cè)設(shè)備部署 AI 模型而設(shè)計的 PyTorch 原生部署框架。兩者的緊密合作,使開發(fā)者能夠賦能更小、更優(yōu)化的模型,包括新的 Llama 3.2 1B 和 3B 量化模型。這些新模型可以減少內(nèi)存占用、提高準(zhǔn)確性、增強性能和提供可移植性,成為小型設(shè)備上的生成式 AI 應(yīng)用的理想選擇,如虛擬聊天機器人、文本摘要和 AI 助手。

      開發(fā)者無需額外的修改或優(yōu)化,便可將新的量化模型無縫集成到應(yīng)用中,從而節(jié)省時間和資源。如此一來,他們能夠迅速在廣泛的 Arm 設(shè)備上大規(guī)模開發(fā)和部署更多的智能 AI 應(yīng)用。

      隨著 Llama 3.2 大語言模型 (LLM) 新版本的發(fā)布,Arm 正在通過 ExecuTorch 框架優(yōu)化 AI 性能,使得在 Arm 計算平臺邊緣設(shè)備運行的真實生成式 AI 工作負(fù)載能更為快速。在 ExecuTorch 測試版發(fā)布的首日起,開發(fā)者便能享有這些性能的提升。

      集成 KleidiAI,加速端側(cè)生成式 AI 的實現(xiàn)

      在移動領(lǐng)域,Arm 與 ExecuTorch 的合作意味著眾多生成式 AI 應(yīng)用,如虛擬聊天機器人、文本生成和摘要、實時語音和虛擬助手等,完全能夠在搭載 Arm CPU 的設(shè)備上以更高的性能運行。這一成果得益于 KleidiAI,它引入了針對 4 位量化優(yōu)化的微內(nèi)核,并通過 XNNPACK 集成到了 ExecuTorch 中,因此,在 Arm 計算平臺上運行 4 位量化的 LLM 時,無縫加速 AI 工作負(fù)載的執(zhí)行。例如,通過 KleidiAI 的集成,Llama 3.2 1B 量化模型預(yù)填充階段的執(zhí)行速度可以提高 20%,使得一些基于 Arm 架構(gòu)的移動設(shè)備上的文本生成速度超過了每秒 400 個詞元 (token)。這意味著,終端用戶將從他們移動設(shè)備上獲得更快速、響應(yīng)更靈敏的 AI 體驗。

      了解更多 Arm 在移動市場對ExecuTorch的支持,請查閱博客文章。

      為物聯(lián)網(wǎng)的邊緣側(cè) AI 應(yīng)用加速實時處理能力

      在物聯(lián)網(wǎng)領(lǐng)域,ExecuTorch 將提高邊緣側(cè) AI 應(yīng)用的實時處理能力,包括智能家電、可穿戴設(shè)備以及自動零售系統(tǒng)等。這意味著物聯(lián)網(wǎng)設(shè)備和應(yīng)用能夠以毫秒級的速度響應(yīng)環(huán)境變化,這對保障安全性和功能可用性至關(guān)重要。

      ExecuTorch 可在 Arm® Cortex®-A CPU 和 Ethos™-U NPU 上運行,以加速邊緣側(cè) AI 應(yīng)用的開發(fā)和部署。事實上,通過將 ExecuTorch 與 Arm Corstone™-320 參考平臺(也可作為仿真固定虛擬平臺 (FVP) 使用)、Arm Ethos-U85 NPU 驅(qū)動程序和編譯器支持集成到一個軟件包中,開發(fā)者可在平臺上市前幾個月就著手開發(fā)邊緣側(cè) AI 應(yīng)用。

      了解更多 Arm 在物聯(lián)網(wǎng)領(lǐng)域?qū)xecuTorch的支持,請查閱博客文章。

      更易獲取、更快捷的邊緣側(cè) AI 開發(fā)體驗

      ExecuTorch 有潛力成為全球最受歡迎的高效 AI 和 ML 開發(fā)框架之一。通過將應(yīng)用最廣泛的 Arm 計算平臺與 ExecuTorch 相結(jié)合,Arm 正在通過新的量化模型加速 AI 的普及,讓開發(fā)者能夠更快地在更多設(shè)備上部署應(yīng)用,并將更多生成式 AI 體驗引入邊緣側(cè)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    [No. H002]
    分享到微信

    即時

    京東11.11跟著采銷走進(jìn)科大訊飛 直播間享專享價與超值福利

    京東11.11采銷直播探廠為消費者揭開答案。近日,京東3C數(shù)碼采銷走進(jìn)武漢攀升工廠、合肥聯(lián)想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產(chǎn)品,并為消費者帶來超值低價與福利。

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。