蘋果智能家居布局曝光:類 iPad 智能屏幕做先鋒,室內攝像頭等打出組合拳北美洲報告的網絡攻擊發(fā)生率最高字節(jié)社交再變陣:抖音內測“朋友圈”、升級朋友功能,停止多閃研發(fā)Oizom推出Pollusense實現空氣質量監(jiān)測的革命性突破雙11眾生相:有人出走,有人入局紅魔10 Pro將首發(fā)7050mAh牛魔王電池:不加厚不加重雷軍:小米SU7第10萬臺車下線,僅用時230天北汽藍谷:與小馬智行達成L4無人駕駛車型開發(fā)合作,計劃在明年推出首批極狐阿爾法T5 Robotaxi騰訊音樂三季度凈利潤勁升35.3%!付費用戶已達1.190億蘋果有望明年3月發(fā)布智能家居顯示器 2026年生產智能攝像頭小鵬汽車前智駕負責人加入比亞迪 曾深度參與無圖智駕開發(fā)SEMI:2024Q3全球硅晶圓出貨面積同比增長6.8%、環(huán)比增長5.9%告別高價流量,這個雙11變了李彥宏的“少數派報告”:如何成為AI時代的1%郵件欺詐新威脅,微軟披露 Exchange Server 高風險漏洞國家郵政局:11月11日快遞業(yè)務量7.01億件 創(chuàng)歷年“雙11”當日新高AMD宣布推出第二代Versal Premium系列,實現全新系統加速水平,滿足數據密集型工作負載需求別再被尺寸迷惑了!98吋對比100吋完勝,這些細節(jié)你絕對想不到!拼多多擬更新價格保護規(guī)則,活動商品均適用降價補差AIGC的全新機遇!北京這場專家云集的AIGC國際會議與大模型應用峰會即將啟幕
  • 首頁 > 產經新聞頻道 > 科技資訊

    Arm 計算平臺加持,全新 Llama 3.2 LLM實現AI 推理的全面加速和擴展

    2024年10月09日 13:46:18   來源:Citnews中文科技資訊

      新聞重點:

      · 在 Arm CPU 上運行 Meta 最新 Llama 3.2 版本,其云端到邊緣側的性能均得到顯著提升,這為未來 AI 工作負載提供了強大支持

      · Meta 與 Arm 的合作加快了用例的創(chuàng)新速度,例如個性化的端側推薦以及日常任務自動化等

      · Arm 十年來始終積極投資AI領域,并廣泛開展開源合作,為 1B 至 90B 的 LLM 實現在 Arm 計算平臺上無縫運行

      人工智能 (AI) 的迅猛發(fā)展意味著大語言模型 (LLM) 的新版本不斷推陳出新。要充分發(fā)揮 AI 的潛力并抓住其帶來的機遇,需要實現 LLM 從云端到邊緣側的廣泛部署,而這也伴隨著對計算和能源需求的大幅增長。整個生態(tài)系統正攜手尋找應對這一挑戰(zhàn)的解決方案,不斷推出新的更加高效的開源 LLM,以便大規(guī)模實現各種 AI 推理工作負載,加快為用戶帶來全新、快速的 AI 體驗。

      為此,Arm與Meta 展開緊密合作,在 Arm CPU 上啟用新的Llama 3.2 LLM,集成開源創(chuàng)新與 Arm 計算平臺的優(yōu)勢,顯著推進了解決AI挑戰(zhàn)的進程。得益于Arm 的持續(xù)投資及與新型LLM 的合作, Arm CPU運行 AI 的優(yōu)勢在生態(tài)系統中脫穎而出,使Arm成為 AI 推理開發(fā)者的首選平臺。

      加速云到邊緣側的 AI 性能

      小型 LLM(如 Llama 3.2 1B 和 3B)能夠支持基于文本的基礎生成式 AI 工作負載,對于大規(guī)模 AI 推理的實現至關重要。通過 Arm CPU 優(yōu)化內核在 Arm 技術驅動的移動設備上運行新的 Llama 3.2 3B LLM,可讓提示詞處理速度提高五倍,詞元 (token) 生成速度提高三倍,在生成階段實現每秒 19.92 個詞元。這將直接減少了在設備上處理 AI 工作負載的延遲,大大提升了用戶整體體驗。此外,當邊緣側能處理的 AI 工作負載越多,往返云端傳輸數據所節(jié)省的電量就越多,進而節(jié)省了能源和成本。

      除了在邊緣側運行小型模型,Arm CPU同樣支持在云端運行更大的模型(如 Llama 3.2 11B 和 90B)。11B 和 90B 的模型非常適合云端基于 CPU 的推理工作負載,可生成文本和圖像,其中,在Arm Neoverse V2上的測試結果展現出了更大的性能提升。在基于 Arm 架構的 AWS Graviton4上運行 11B 的圖像和文本模型,可以在生成階段實現每秒 29.3 個詞元的表現,遠遠超出了人類大約每秒閱讀五個詞元的速度。

      AI 將通過開源創(chuàng)新和生態(tài)系統協作迅速擴

      能公開獲取新的 LLMs(如Llama 3.2)至關重要。開源創(chuàng)新正以迅猛速度發(fā)展,在之前的版本中,開源社區(qū)在不到 24 小時的時間內便能在 Arm 上部署并運行新的 LLM。

      Arm將通過Arm Kleidi進一步支持軟件社區(qū),讓整個 AI 技術棧能夠充分發(fā)揮這一優(yōu)化的 CPU 性能。Kleidi 可在任何 AI 框架上解鎖 Arm Cortex 和 Neoverse CPU 的 AI 功能和性能,無需應用程序開發(fā)者進行額外的集成工作。

      通過最近的Kleidi 與 PyTorch 集成以及正在推進的與 ExecuTorch 集成,Arm正在為基于 Arm CPU的開發(fā)者提供從云端到邊緣側的無縫 AI 性能。得益于Kleidi 與 PyTorch 的集成,在基于 Arm 架構的 AWS Graviton 處理器上運行 Llama 3 LLM 的詞元首次響應時間加快了 2.5 倍。

      同時,在端側,與參考實現相比,在 KleidiAI 庫的加持下,使用 llama.cpp庫在新的Arm Cortex-X925 CPU上運行 Llama 3 的詞元首次響應時間加快了 190%。

      構建 AI 的未來

      Arm與Meta的合作成為了行業(yè)合作的新標桿,匯聚了 Arm 計算平臺的靈活性、普及性和 AI 功能,以及 Meta 等行業(yè)巨頭的技術專長,共同解鎖AI 廣泛應用的新機遇。無論是利用端側 LLM 滿足用戶的個性化需求,如根據用戶所處的位置、日程和偏好來執(zhí)行任務,還是通過企業(yè)級應用來優(yōu)化工作效率,讓用戶能夠更專注于戰(zhàn)略性任務,Arm 技術的集成都為未來奠定了基礎。未來,設備不再只是命令和控制工具,更是能在提升用戶整體體驗方面扮演積極的作用。

      在 Arm CPU 上運行 Meta 最新 Llama 3.2 版本,其AI 性能實現了顯著提升。這類開放式合作是實現無處不在的 AI 創(chuàng)新、促進AI可持續(xù)發(fā)展的最佳途徑。通過新的 LLM、開源社區(qū)和 Arm 的計算平臺,Arm 正在構建 AI 的未來,到 2025 年,將有 1000 多億臺基于 Arm 架構的設備支持 AI。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    [No. H002]
    分享到微信

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現優(yōu)異,同比有14%的漲幅,傳統電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯網標識解析體系

    9月14日,2024全球工業(yè)互聯網大會——工業(yè)互聯網標識解析專題論壇在沈陽成功舉辦。