上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術邂逅千年色彩美學!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領域三星新專利探索AR技術新應用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機器也能說人話了?阿里國際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領先的目標網(wǎng)絡AI 3D生成天花板再拉升!清華團隊煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團喜歡“追風口”快手電商新增近800個“0元開店”類目,推出多項新商入駐權益年內(nèi)狂攬五項第一,“字節(jié)系大模型”何以后發(fā)先至?
  • 首頁 > 產(chǎn)經(jīng)新聞頻道 > 科技資訊

    0.6秒!手機跑Stable Diffusion創(chuàng)下最快速度,而這僅僅是開始

    2023年11月16日 16:49:29   來源:中文科技資訊

      導語:如今,隨著將大模型塞進手機的進程加快,普通用戶也能親自體驗生成式AI的魅力了。

      2023 已經(jīng)行至尾聲,這一年大模型和生成式 AI成為人工智能圈的主流趨勢。自ChatGPT 出現(xiàn)以來,各式各樣通用、專業(yè)的 AI 大模型層出不窮,噴涌之勢已經(jīng)不可阻擋。隨著量化、網(wǎng)絡剪枝和知識蒸餾等模型壓縮技術進步,手機等終端設備AI算力持續(xù)增強,大模型在云端部署之外正在向終端落地邁進。

    1700119921105038.png

      對于這場已經(jīng)拉開了序幕的「終端側革命」,芯片巨頭和手機廠商們成為主力軍,他們不斷嘗試在手機等終端設備上部署運行生成式AI大模型,時不時給人們一點小小的驚喜和震撼。

      今年2月,我們第一次看到了在手機上運行超過10 億參數(shù)的文生圖大模型Stable Diffusion。那是在一部搭載高通第二代驍龍 8移動平臺的安卓手機上運行的,不到15秒的時間執(zhí)行20步推理,生成了一張512×512像素的圖像。這也創(chuàng)造了當時智能手機上最快的推理速度。

      你以為這就是手機運行Stable%20Diffusion的速度極限了嗎?顯然不是。在上個月舉行的2023驍龍技術峰會上,不到15秒的生成時間又被整整縮短數(shù)十倍。高通最新旗艦移動平臺第三代驍龍8(以下簡稱驍龍8%20Gen%203)讓速度飛升成為可能。

      在峰會現(xiàn)場,高通用搭載了驍龍%208%20Gen%203的手機運行相同的Stable%20Diffusion大模型,這次不到1秒(0.6秒)的時間便在本地生成了一張圖像。從15秒到0.6秒,終端側生成式AI大模型的進化速度讓我們驚嘆不已。

      這只是高通在本屆驍龍技術峰會上展示其終端側AI能力的牛刀小試。除了生成速度(從%2015%20秒到%200.6秒)有了質(zhì)的飛躍,驍龍8%20Gen%203將支持運行的大模型參數(shù)規(guī)模(從10億到百億)提升一個量級。

      大模型賦能平臺也不再局限于手機,高通下一代%20AI%20PC%20芯片驍龍X%20Elite亮相,將百億參數(shù)大模型「塞進」PC平臺,極大拓展了生成式AI應用的廣度。

      至此,高通在終端側AI領域積累起來的領導力和技術領先性進一步得到加強,更賦予了手機、PC,甚至耳機等廠商更多終端AI落地的想象力和可能性。

      雙平臺并進,讓生成式AI更加觸手可及

      自今年2月以來,高通先后在搭載第二代驍龍8移動平臺的安卓手機上運行Stable%20Diffusion、ControlNet,讓大模型跑在手機端成為現(xiàn)實。此次驍龍峰會上發(fā)布的驍龍%208%20Gen%203%20將大模型終端側落地的潛力提升到了新的高度,使其自身繼續(xù)在該領域引領潮流。

      據(jù)了解,驍龍8%20Gen%203采用的高通AI引擎擁有面向移動終端的強大Hexagon%20NPU,集成了升級后的硬件加速單元、微切片推理單元、加強張量、標量和矢量單元,所有單元共享%202%20倍帶寬的大容量共享內(nèi)存。同時支持%20INT8+INT16的混合精度以及%20INT4、INT8、INT16和FP16的所有精度。性能較前代提升98%,能效提升40%。

      驍龍%208%20Gen%203%20集成的高通傳感器中樞也更強,擁有2個始終感應ISP、2個micro%20NPU和1個DPS,內(nèi)存增加了30%,支持INT4精度,AI性能提升了3.5倍。

      可以說,驍龍 8 Gen 3賦予了手機前所未有的強大終端側AI性能,成為高通首個專為生成式AI打造的移動平臺。那么這款旗艦級移動平臺是否名副其實呢?這是我們大家最為關心的問題。

      在該平臺上,高通AI引擎首次支持多模態(tài)生成式AI,包括了多種大語言模型、視覺語言模型等。尤其是在終端側,驍龍8 Gen 3 首次支持運行 100億參數(shù)的模型,規(guī)模邁入百億量級。同時將 Stable Diffusion 生成圖像的時間降到了1秒之內(nèi),再次創(chuàng)下最快速度。

      在跑Meta大語言模型Llama2-7B時,驍龍8 Gen 3每秒可以生成20個token,同樣是手機終端側最快之一。

    1700119962158195.png

      (圖注)高通產(chǎn)品管理高級副總裁Ziad Asghar

      驍龍平臺已經(jīng)支持運行OpenAI、Meta、微軟、安卓、stability.ai、BLOOM、百度、智譜、百川智能、有道等企業(yè)或機構的大模型,既為這些廠商將自身大模型能力「下放」到終端側提供契機,也為用戶體驗生成式AI帶來了豐富的選擇項。

      牽一發(fā)而動全身,隨著高通在賦能大模型終端落地上的進一步動作,采用驍龍 8 Gen 3移動平臺的手機廠商快速跟進,加速了大模型集成到手機的進程。

      以首發(fā)搭載驍龍 8 Gen 3移動平臺的小米14系列新機為例,AI大模型技術已經(jīng)集成到小米全新澎湃 OS 中,并上線各種終端側應用。有了大模型能力加持,小米14 支持了 AI 妙畫、AI搜圖、AI寫真、AI擴圖等多項功能,讓輸入法、WPS、相冊煥發(fā)新的活力。

    20231116154221_485401700120541.gif

      vivo旗下品牌iQOO 12系列同樣搭載了驍龍8 Gen 3移動平臺,全新高通AI引擎使其影像體驗大幅升級,照片質(zhì)感和細節(jié)拉滿。同時該系列手機預裝的 OriginOS 4系統(tǒng)引入生成式AI功能,AI助手藍心小V可以進行超能語義搜索、超能問答、超能寫作、超能創(chuàng)圖、超能智慧交互,智能化程度明顯提升。

      此前在驍龍峰會上,榮耀CEO趙明宣布新旗艦手機榮耀Magic%206將搭載驍龍8%20Gen%203移動平臺,已支持70億參數(shù)的終端側AI大模型,為用戶提供更加智能化的體驗。他在現(xiàn)場演示了終端側AI進行照片搜索、生成視頻等智能操作,效果著實不錯。

      手機終端融合大模型能力催生了大量或好玩、或有助于提升生產(chǎn)力的生成式%20AI應用。未來更加豐富的生成式AI應用會讓更多用戶切身體驗到%20AI的魅力,提升自身交互體驗,這也正是高通致力于在終端側打造生成式AI能力的重要源動力之一。

      在持續(xù)利用AI賦能手機移動平臺之外,高通也在尋求利用并把握好大模型及生成式AI的發(fā)展契機,以此來重塑PC行業(yè),擴大自身在AI領域的領先優(yōu)勢。

      生成式AI有了「第二陣地」

      高通發(fā)布了面向PC%20平臺的全新處理器驍龍X%20Elite,它采用4nm制程工藝,集成定制的高通Oryon%20CPU,運行速度是英特爾%2012%20核處理器的%202倍,功耗比英特爾競品低68%,高峰時段的運行速度比蘋果M2快了50%。

      如果這些參數(shù)還無法讓你相信驍龍X%20Elite的強悍,那就跑個分吧。驍龍%20X%20Elite%20擁有兩個版本:注重續(xù)航表現(xiàn)的%2023W%20版本、主打性能的%2080W版本。Geekbench%206測試下的單核和多核得分情況如下圖所示,單核性能尤為亮眼。

      (圖注)圖源fonearena

      同樣地,驍龍X Elite專為AI打造。它采用業(yè)界領先的、集成高通Hexagon NPU的高通AI引擎,異構算力高達75TOPS,Hexagon NPU算力為45TOPS,為創(chuàng)意應用、視頻會議和生產(chǎn)力助手的變革性體驗提供了算力基礎。高通 AI引擎還支持了大量的加速應用程序和體驗,創(chuàng)造無限可能性。

      超強生成式 AI 能力也成為驍龍X Elite的一大標簽,截止到發(fā)布時,它已支持在端側運行超過130億參數(shù)的生成式AI模型,面向70億參數(shù)大模型每秒生成30個token,AI處理速度是競品的4.5倍。下圖為PC端AI作畫能力的展示。

      從手機到%20PC,多樣化的端側平臺為釋放生成式%20AI能力提供了更多渠道。這也表明,高通在終端側生成式AI落地這條賽道上繼續(xù)「加碼」,背后既離不開技術上的厚積薄發(fā),也是其在大模型時代自身AI發(fā)展戰(zhàn)略的延續(xù)。

      手機、PC加速迎來全新AI時代

      在當今大模型時代,終端側部署生成式AI這條路線越來越明晰;诖耍咄ū帧富旌螦I是AI的未來」這一理念和戰(zhàn)略,注重云端與終端的協(xié)同發(fā)展,并認為終端側AI是擴展生成式AI至全球更廣泛范圍的關鍵。

      遵循這一前瞻性認知,高通一步步積累,逐漸在自身布局中構建了強大、全面的終端側AI能力,并引領了端側大模型及生成式AI的革新與進步。毫無疑問,此次驍龍峰會上發(fā)布的驍龍%208%20Gen%203、驍龍X%20Elite將進一步夯實高通作為終端側AI領導者的地位。

      (圖注)高通全棧AI優(yōu)化方案

      如果大模型繼續(xù)保持當前的落地步伐,我們將可以在手機、PC 甚至XR可穿戴設備、智能網(wǎng)聯(lián)汽車等智能終端上體驗到更多生成式AI應用,讓人機交互更加自然且個性化。反過來,這些生成式AI應用以及帶來的體驗變革也將對這些終端設備產(chǎn)生深遠影響,甚至改變它們的核心驅(qū)動力,重新定義它們。

      我們以與人們?nèi)粘9ぷ、生活息息相關的手機為例,在追求絕對性能之外,人們越來越多地關注一些創(chuàng)意性應用。這就需要AI大顯身手,生成式AI性能更是成為下一代手機處理器角逐的核心競爭力。

      驍龍移動平臺近年來持續(xù)發(fā)力于此也在意料之中了。從去年的驍龍8 Gen 2 到此次驍龍峰會上的驍龍 8 Gen 3,AI 早已無處不在,生成式 AI 一躍成為「AI 皇冠上的新明珠」,受到了廣泛關注和青睞。

      隨著大模型及生成式AI在手機終端落地的范圍越來越廣、成熟度越來越高,我們或許可以看到:傳統(tǒng)智能手機被生成式 AI 能力全方位加持的「AI 手機」所取代。小米等手機廠商新發(fā)布的旗艦機在這方面已經(jīng)初具雛形,利用生成式AI增強一些場景的使用體驗和效率,為未來顛覆手機的質(zhì)變做好了充分的量變。

      同時,PC 終端的革新也有類似向生成式 AI 能力傾斜的發(fā)展趨勢。在這方面,集成到Windows 中的微軟 Copilot是一個很好的例證。當然還有更多生成式AI變革人類與 PC 交互的場景和方式,借此實現(xiàn)更高效的智能協(xié)作、更簡化的工作流程、更強大的生產(chǎn)力、更定制化的使用體驗。

      驍龍 X Elite 一出手便瞄準生成式 AI,勢必會為當前的PC市場注入新鮮血液。在第六屆虹橋國際經(jīng)濟論壇 ——「智能科技與未來產(chǎn)業(yè)發(fā)展」分論壇上,高通公司中國區(qū)董事長孟樸發(fā)表了主題演講,認為下一代 PC 將進入一個全新的「AI PC」時代,以智能、高性能、高效等為特點, 并將對辦公效率等方面產(chǎn)生重要意義。

      相信未來高通會在驍龍 8 Gen 3 等移動平臺和驍龍 X Elite等PC平臺的基礎上,繼續(xù)加強自身在大模型和生成式AI上的基礎能力。加之更多搭載這些平臺的廠商發(fā)布全新旗艦手機和 PC 產(chǎn)品,他們不斷增強的自主性及自研能力可以讓我們期待更多樣化生成式AI應用的亮相。

      不過,在「AI 手機」和「AI PC 時代」真正到來之前,還要看生成式AI能力是否能讓用戶產(chǎn)生強烈感知、是否能準確滿足他們的需求、是否能對相關應用產(chǎn)生依賴性、以及是否能帶動他們換機的欲望,這些都是高通和手機廠商現(xiàn)在及未來要考慮的問題。

      結語

      自發(fā)布以來,驍龍 8 Gen 3、驍龍X Elite展現(xiàn)出的強大生成式AI能力留給人們無限的想象空間。 正如高通公司總裁兼 CEO 安蒙所言,「我們正在進入將改變用戶體驗的生成式AI時代,也將創(chuàng)造一個移動行業(yè)和計算行業(yè)的全新周期!

      在這一進程中,作為終端側領導者的高通正擔負起應有的時代角色。一方面,利用自身強大的全棧AI優(yōu)化能力匯聚軟硬件各方,助力終端側AI生態(tài)快速發(fā)展;另一方面,全新的跨平臺技術「Snapdragon Seamless」實現(xiàn)安卓、Windows 和其他操作系統(tǒng)無縫銜接,這種多終端體驗有望將 AI在手機、PC 等終端上的落地進一步拓展開來。

      可以預見,基于驍龍生態(tài)的AI體驗會非常快速鋪展開來,各種應用落地的速度也將大大加快。未來,高通將繼續(xù)保持自身在終端側AI的技術優(yōu)勢,推動大模型在部署應用時更便捷、更豐富、更有吸引力。同時,攜手各大廠商創(chuàng)新基于大模型的生成式AI應用,降低普通用戶使用生成式AI的門檻。

      隨著新的生成式AI時代開啟,高通是否能持續(xù)滿足人們的期待,我想這次驍龍峰會已經(jīng)給了我們答案。

      (文章轉(zhuǎn)載自機器之心公眾號)

      文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    [No. X026]
    分享到微信

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產(chǎn)品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相,以敢為精神勇闖技術無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。