" />
突破敘事尺度 刻畫極致人物 迷霧劇場《漂白》1月17日上線愛奇藝1月20日手機數(shù)碼國補落地京東 超千萬國補商品等你挑選超千萬貨品已備足 1月20日來京東購手機享國家補貼每件最高500元擁抱創(chuàng)新科技,探尋體育變革之路—— 第二屆LALIGA EXTRATIME體育行業(yè)論壇在京成功舉辦斑馬技術《2025全球消費者調查報告》:注重防損管理,增強顧客體驗終端創(chuàng)企Nothing擬募資1億美元 一加聯(lián)合創(chuàng)始人創(chuàng)立恩智浦獲歐洲投資銀行 10 億歐元貸款,用于在歐多國研發(fā)創(chuàng)新工作入手松下ZS99相機新品首選京東 售價2998元可先人一步入手1月20日打開京東搜索「1」 3C數(shù)碼“瘋狂星期一”爆款低至1元當代年輕人用上AI,從夸克開始消息稱iPhone SE 4將有白色和黑色 預計3月份推出全球PC市場迎來溫和復蘇:2024年出貨量增長1.3%,聯(lián)想和蘋果表現(xiàn)亮眼比亞迪已在韓國推出Atto 3 預計2月中旬開始交付發(fā)展新質生產(chǎn)力 賦能健康產(chǎn)品力 ——勁牌有限公司2024年度科技責任(成果)報告美光減產(chǎn)后 SK海力士也計劃將上半年NAND閃存產(chǎn)量削減一成趙明離職信曝光:離開榮耀是人生中最艱難的決定消息稱京東服飾換帥,阿里前高管擔任負責人這年頭,誰在互聯(lián)網(wǎng)上學這么“硬核”的AI?開戰(zhàn)2025,本地生活商家「另辟蹊徑」年底Mini LED電視到底怎么選?認準這些新技術不踩雷!
  • 首頁 > 企業(yè)IT頻道 > 人工智能

    關注人工智能領域的巨大能耗問題

    2021年03月18日 20:12:43   來源:烽巢網(wǎng)

      人工智能領域的深度學習模型越具有開創(chuàng)性,它們的規(guī)模就越大。今年最熱門的自主語言處理模型GPT-3就是一個很好的例子。為了達到像人類一樣書寫的準確性和速度水平,這個模型需要1750億個參數(shù)、350 GB內存和至少1200萬美元資金的投入。但是,除了成本之外,像這樣的大型人工智能模型還面臨一個巨大的能耗問題。

    1.jpg

      馬薩諸塞大學阿默斯特分校的研究人員發(fā)現(xiàn),訓練一個大型人工智能模型所需的計算能力可以產(chǎn)生超過60萬磅的二氧化碳排放——這是一輛普通汽車在其壽命內排放量的5倍! 這些模型通常需要更多的能量來處理并生成設置(或稱為推理階段)。英偉達估計,運行神經(jīng)網(wǎng)絡模型所產(chǎn)生的成本中,有80- 90%來自推理過程,而不是訓練過程。

      為了在人工智能領域取得更大的進展,普遍觀點認為,我們將不得不做出巨大的環(huán)境權衡。但事實并非如此,大型模型可以縮小到可以在日常工作站上或服務器上運行,而不必犧牲準確性和速度。

      過往:計算能力平均每3.4個月翻一番

      十多年前,斯坦福大學(Stanford University)的研究人員發(fā)現(xiàn),用于驅動視頻游戲中的圖形處理器(稱為Gpu),可以用于深度學習模型。這一發(fā)現(xiàn)引發(fā)了一場為深度學習應用程序創(chuàng)建越來越強大的專用硬件的競賽。反過來,科學家們創(chuàng)建的模型變得越來越大。其邏輯是,更大的模型會導致更準確的結果。硬件功能越強大,這些機型運行速度就越快。

      OpenAI的研究證明,這一假設在該領域已被廣泛采用。從2012年到2018年,深度學習模型的計算能力平均每3.4個月翻一番。所以,這意味著在6年的時間里,用于人工智能的計算能力增長了驚人的30萬倍。如上所述,這種能力不僅用于訓練算法,還可以在生成設置中使用它們。麻省理工學院(MIT)最近的一項研究表明,我們可能會比想象中更快地達到計算能力的上限。

      更重要的是,資源的限制使得深度學習算法的使用僅限于那些有能力使用它的人。當深度學習可以應用于從醫(yī)學成像中檢測癌細胞到阻止在線仇恨言論的所有領域時,我們不能限制訪問。不過,我們也不能承受建造更大、更耗電的模型所帶來的環(huán)境后果。

      未來:變得越來越小

      幸運的是,研究人員發(fā)現(xiàn)了一些新的方法來縮小深度學習模型,并通過更智能的算法來改變訓練數(shù)據(jù)集的應用。通過這種方式,大型模型可以在生產(chǎn)環(huán)境中以更低的能耗運行,并且仍然可以根據(jù)用例實現(xiàn)預期的結果。

      這些技術有可能使機器學習大眾化,為更多沒有數(shù)百萬美元來投資訓練算法并將其投入生產(chǎn)的組織服務。這對于“邊緣”用例尤其重要,想想相機、汽車儀表盤、智能手機等微型設備吧,在這些用例中,大型的、專門的AI硬件在物理上是不實用的。

      研究人員正在通過刪除神經(jīng)網(wǎng)絡中一些不需要的連接,或者通過簡化數(shù)學運算來縮小模型。這些更小、更快的模型可以在任何地方運行,其精度和性能與大型模型相似。這意味著我們不再需要爭先恐后地使用最強大的計算能力,從而對環(huán)境造成更大的破壞。讓大型模型變得更小、更高效是深度學習的未來。

      另一個主要問題是針對不同的用例,在新的數(shù)據(jù)集上一遍又一遍地訓練大型模型。一種叫做遷移學習的技術可以幫助防止這個問題。遷移學習使用預先訓練的模型作為起點。模型的知識可以通過一個有限的數(shù)據(jù)集“轉移”到一個新的任務中,而不必從頭開始重新訓練原始模型。這是朝著減少訓練新模型所需的計算能力、能源和資金邁出的關鍵一步。

      底線是什么?

      模型可以(而且應該)在任何可能的情況下縮小,以使用更少的計算能力。并且知識可以被回收和重用,而不是從頭開始深度學習的訓練過程。最終,找到減少模型大小和相關計算能力的方法(在不犧牲性能或精度的情況下)將是深度學習的下一個偉大突破。通過這種方式,任何人都能夠以更低的成本在生產(chǎn)中運行這些應用程序,而無需在環(huán)境方面做出巨大的犧牲。當我們把大型人工智能放在小的地方時,一切都是可能的——甚至是幫助阻止氣候變化的毀滅性影響。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。