合合信息:破解大模型語(yǔ)料庫(kù)難題的引領(lǐng)者核聚變2024北京站高能開(kāi)幕,ROG電競(jìng)顯示器強(qiáng)勢(shì)助力游戲狂歡華為企業(yè)客戶(hù)支持圓桌會(huì)議成功舉辦,共筑ICT基礎(chǔ)設(shè)施維護(hù)新未來(lái)66元搶爆款A(yù)R眼鏡!京東AR眼鏡超級(jí)新品日30天無(wú)憂(yōu)適用等你來(lái)攜手共進(jìn),智啟未來(lái) —— 華為與CypressTel賽柏特成立 SD-WAN 聯(lián)合創(chuàng)新實(shí)驗(yàn)合合信息成功IPO開(kāi)啟新篇章全球首款第二代酷睿Ultra處理器筆記本!聯(lián)想YOGA Air 15 Aura AI元啟版開(kāi)啟預(yù)售中國(guó)品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書(shū)本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國(guó) 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫(huà)像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車(chē)產(chǎn)量突破 100 萬(wàn)輛,到 2027 年建成萬(wàn)億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線(xiàn):iPhone用戶(hù)可在朋友圈發(fā)實(shí)況照片了蘋(píng)果有線(xiàn)耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚(yú)相關(guān)搜索量暴漲384%2024 vivo開(kāi)發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來(lái)了,阿里云「通義靈碼」全面進(jìn)化,全流程開(kāi)發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷(xiāo)量及銷(xiāo)售額領(lǐng)先鴻蒙PC要來(lái)了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%
  • 首頁(yè) > 產(chǎn)經(jīng)新聞?lì)l道 > 業(yè)界新聞

    深度學(xué)習(xí)紅利將盡,AI 是否又面臨「死亡之谷」?

    2021年03月01日 09:39:49   來(lái)源:極客公園

      陷入又一輪 AI 寒冬?

      人工智能存在于許多我們每天與之交互的技術(shù)中,比如最常見(jiàn)的語(yǔ)音助手和個(gè)性化推薦,以及不斷成熟的自動(dòng)駕駛。從去年到現(xiàn)在,AI 領(lǐng)域更是好消息不斷,OpenAI 的,它在下棋和游戲前完全不知道游戲規(guī)則,完全通過(guò)自己摸索贏得棋局。一時(shí)間,「AI 將替代人類(lèi)」的聲音不絕于耳。

      但另一面,人類(lèi)豐滿(mǎn)的 AI 夢(mèng),也正在撞上骨感的現(xiàn)實(shí)。近期,IBM 旗下的 Watson Health 被傳出將甩手賣(mài)掉,這個(gè)曾想替人類(lèi)解決腫瘤治療的 AI 部門(mén) 6 年來(lái)從未盈利。更致命的是,Watson Health 的診斷精度和專(zhuān)家結(jié)果只有 30% 的重合。

    1.jpg

      看向國(guó)內(nèi),「AI 四小龍」中的商湯科技和曠視科技,時(shí)不時(shí)傳出計(jì)劃上市的消息,但似乎都中了「上市難」的魔咒。曠視科技的創(chuàng)始人印奇在去年 7 月,曾對(duì)媒體表示 AI 的快速爆發(fā)期發(fā)生在五六年前,現(xiàn)在正處于「死亡之谷」的泡沫期。繁榮表象之外的冰冷現(xiàn)實(shí),都能讓人想到「人工智能的寒冬」:與 AI 有關(guān)的研究或其他項(xiàng)目難以獲得資金,人才和公司停滯不前。

      清華大學(xué)人工智能研究院院長(zhǎng)張鈸曾表示,行業(yè)崇尚深度學(xué)習(xí),但它本身的「缺陷」決定了其應(yīng)用的空間被局限在特定的領(lǐng)域——大部分都集中在圖像識(shí)別、語(yǔ)音識(shí)別。而目前深度學(xué)習(xí)似乎已經(jīng)到了瓶頸期,就算財(cái)力和算力仍在不斷投入,但深度學(xué)習(xí)的回報(bào)率卻沒(méi)有相應(yīng)的增長(zhǎng)。

      「目前基于深度學(xué)習(xí)的人工智能在技術(shù)上已經(jīng)觸及天花板,此前由這一技術(shù)路線(xiàn)帶來(lái)的『奇跡』在 AlphaGo 獲勝后未再出現(xiàn),而且估計(jì)未來(lái)也很難繼續(xù)大量出現(xiàn)!箯堚撜f(shuō)。

      被寄予厚望的深度學(xué)習(xí),是否會(huì)讓人工智能陷入又一輪寒冬?「在每一次人工智能『寒冬』到來(lái)之前,科學(xué)家都會(huì)夸大他們的研究的潛力。僅僅說(shuō)他們的算法擅長(zhǎng)某一項(xiàng)任務(wù)還不夠,他們恨不得說(shuō) AI 能解決所有事。」長(zhǎng)期研究數(shù)據(jù)科學(xué)和 AI 的作者 Thomas Nield 說(shuō)道。但真正的通用人工智能,離我們似乎還很遙遠(yuǎn)。

      深度學(xué)習(xí)是什么?

      就在 AI 慢慢沉寂,變成「隱學(xué)」的時(shí)候,Geoffrey Hinton、Yoshua Bengio 和 Yann LeCon 三位學(xué)者默默開(kāi)始了 AI 的一個(gè)重要分支——神經(jīng)網(wǎng)絡(luò)——的研究。

      簡(jiǎn)單來(lái)說(shuō),神經(jīng)網(wǎng)絡(luò)就是一層層的數(shù)字,這些數(shù)字又被稱(chēng)為「神經(jīng)元」。之所以這樣命名,是因?yàn)榭茖W(xué)家認(rèn)為這些數(shù)字相互聯(lián)系,傳遞信號(hào),就像大腦里的神經(jīng)元通過(guò)突觸來(lái)傳遞神經(jīng)刺激一樣。而神經(jīng)網(wǎng)絡(luò)里的每一層數(shù)字都通過(guò)一些約定的數(shù)學(xué)規(guī)則從上一層的數(shù)字計(jì)算得到。

      而「深度學(xué)習(xí)」的概念源于神經(jīng)網(wǎng)絡(luò)的研究,是研究神經(jīng)網(wǎng)絡(luò)的學(xué)問(wèn)。這里的「深度」,指的就是神經(jīng)網(wǎng)絡(luò)含有無(wú)數(shù)隱層,深不可測(cè)。

      機(jī)器要模擬人類(lèi)行為,要先獲取數(shù)據(jù),然后經(jīng)過(guò)預(yù)處理、特征提取、特征選擇,再到推理、預(yù)測(cè)或識(shí)別。其中最關(guān)鍵的,就是中間的三個(gè)步驟,同時(shí)也是系統(tǒng)中最耗費(fèi)計(jì)算的部分。在現(xiàn)實(shí)中,一般都是靠人工提取特征,而深度學(xué)習(xí)的思路是自動(dòng)學(xué)習(xí)特征。

      深度學(xué)習(xí)模型一般由輸入層,隱層和輸出層構(gòu)成;舅枷胧牵荷弦粚拥妮敵鲎鳛橄乱粚拥妮斎,來(lái)實(shí)現(xiàn)對(duì)輸入信息的分級(jí)表達(dá),進(jìn)而通過(guò)組合低層特征形成更加抽象的高層表示屬性類(lèi)別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征。也就是說(shuō),機(jī)器學(xué)會(huì)「抽象思考」了。

      上述三位 AI 泰斗堅(jiān)持著自己的學(xué)術(shù)方向,把神經(jīng)網(wǎng)絡(luò)推廣到了更多的領(lǐng)域,比如計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等等。終于在幾十年后,他們等來(lái)了屬于深度學(xué)習(xí)的時(shí)代。互聯(lián)網(wǎng)和移動(dòng)端的興起讓海量的數(shù)據(jù)唾手可得,而計(jì)算機(jī)硬件在人類(lèi)一次又一次挑戰(zhàn)著納米世界的極限中,順著摩爾的預(yù)言一路狂奔。2012 年,深度學(xué)習(xí)暴得大名,因?yàn)?Geoffrey Hinton 基于卷積神經(jīng)網(wǎng)絡(luò)的 AlexNet 以驚人優(yōu)勢(shì)贏下 ImageNet 視覺(jué)識(shí)別挑戰(zhàn)賽。另外在這個(gè)實(shí)驗(yàn)中,人們發(fā)現(xiàn),只有圖像的樣本量夠大,隱層夠多,識(shí)別率就能大幅提高,這極大地鼓舞了學(xué)界和企業(yè)。

      數(shù)據(jù)越多,越智能?

      OpenAI 最新的自然語(yǔ)言處理模型 GPT-3,幾乎是把整個(gè)互聯(lián)網(wǎng)的浩瀚內(nèi)容全部讀完了。它總共閱讀了大約 5000 億詞,模型大概有 1750 億參數(shù)。系統(tǒng)有上萬(wàn)個(gè) CPU/GPU,它們 24 小時(shí)不間斷地「閱讀」任何領(lǐng)域的信息,半個(gè)月讀完了整個(gè)互聯(lián)網(wǎng)的內(nèi)容。猛灌數(shù)據(jù)量,是這個(gè) AI 模型的「暴力」所在。

      但 GPT-3 也并不能因此變得完全像人,比如,它對(duì)不符合人類(lèi)常理的「?jìng)螁?wèn)題」也會(huì)應(yīng)答,這恰恰證明它并不理解問(wèn)題本身。前 Uber 人工智能實(shí)驗(yàn)室的負(fù)責(zé)人 Gary Marcus 就曾對(duì)深度學(xué)習(xí)多次潑冷水:「人類(lèi)可以根據(jù)明確的規(guī)律學(xué)習(xí),比如學(xué)會(huì)一元二次方程的三種形式以后就可以用來(lái)解各種題目;見(jiàn)過(guò)了京巴、柴犬之后,再見(jiàn)到德牧就知道它也是一種狗。然而深度學(xué)習(xí)不是這樣的,「越多的數(shù)據(jù) = 越好的模型表現(xiàn)」,就是深度學(xué)習(xí)的基本規(guī)律,它沒(méi)有能力從字面上給出的規(guī)律學(xué)習(xí)!

      「深度學(xué)習(xí)是尋找那些重復(fù)出現(xiàn)的模式,因此重復(fù)多了就被認(rèn)為是規(guī)律(真理),因此謊言重復(fù)一千遍就被認(rèn)為真理,所以為什么大數(shù)據(jù)有時(shí)會(huì)做出非常荒唐的結(jié)果,因?yàn)椴还軐?duì)不對(duì),只要重復(fù)多了它就會(huì)按照這個(gè)規(guī)律走,就是誰(shuí)說(shuō)多了就是誰(shuí)!箯堚撛菏恳脖硎旧疃葘W(xué)習(xí)「沒(méi)有那么玄」。

      由于它不能真正理解知識(shí),「深度學(xué)習(xí)學(xué)到的知識(shí)并不深入,而且很難遷移!筂arcus 說(shuō)道。而 AI 系統(tǒng)動(dòng)輒擁有千億參數(shù),儼然就是一個(gè)黑匣子一般的謎。深度學(xué)習(xí)的不透明性將引致 AI 偏見(jiàn)等系列問(wèn)題。最主要的是,AI 還是要為人所用,「你要它做決策,你不理解它,飛機(jī)就讓它開(kāi),誰(shuí)敢坐這架飛機(jī)?」張鈸強(qiáng)調(diào) AI 必須擁有可解釋性。

      最主要的是,給 AI 猛灌數(shù)據(jù)的做法極其考驗(yàn)算力。MIT 研究人員理解深度學(xué)習(xí)性能和算力之間的聯(lián)系,分析了 Arxiv.org 上的 1058 篇論文和資料,主要分析了圖像分類(lèi)、目標(biāo)檢測(cè)、問(wèn)題回答、命名實(shí)體識(shí)別和機(jī)器翻譯等領(lǐng)域兩方面的計(jì)算需求:

      1、每一網(wǎng)絡(luò)遍歷的計(jì)算量,或給定深度學(xué)習(xí)模型中單次遍歷(即權(quán)值調(diào)整)所需的浮點(diǎn)運(yùn)算數(shù)。

      2、訓(xùn)練整個(gè)模型的硬件負(fù)擔(dān),用處理器數(shù)量乘以計(jì)算速度和時(shí)間來(lái)估算。

      結(jié)論顯示,訓(xùn)練模型的進(jìn)步取決于算力的大幅提高,具體來(lái)說(shuō),計(jì)算能力提高 10 倍相當(dāng)于 3 年的算法改進(jìn)成果。換言之,算力提高的背后,其實(shí)現(xiàn)目標(biāo)所隱含的計(jì)算需求——硬件、環(huán)境和金錢(qián)等成本將變得無(wú)法承受。

      摩爾定律假定計(jì)算能力每?jī)赡攴环penAI 一項(xiàng)研究表明,AI 訓(xùn)練中使用的計(jì)算能力每三到四個(gè)月翻一番。自 2012 年以來(lái),人工智能要求計(jì)算能力增加三十萬(wàn)倍,而按照摩爾定律,則只能將 AI 提升 7 倍。人們從來(lái)沒(méi)有想到芯片算力極限會(huì)這么快到來(lái)。

      算力供不起是一回事,但業(yè)界甚至認(rèn)為這種「暴力」模式方向錯(cuò)了!钢R(shí)、經(jīng)驗(yàn)、推理能力,這是人類(lèi)理性的根本,F(xiàn)在形成的人工智能系統(tǒng)都非常脆弱容易受攻擊或者欺騙,需要大量的數(shù)據(jù),而且不可解釋?zhuān)嬖诜浅?yán)重的缺陷,這個(gè)缺陷是本質(zhì)的,由其方法本身引起的。」張鈸表示,「深度學(xué)習(xí)的本質(zhì)就是利用沒(méi)有加工處理過(guò)的數(shù)據(jù)用概率學(xué)習(xí)的『黑箱』處理方法來(lái)尋找它的規(guī)律,它只能找到重復(fù)出現(xiàn)的模式,也就是說(shuō),你光靠數(shù)據(jù),是無(wú)法達(dá)到真正的智能!

      深度學(xué)習(xí)紅利將盡,但 AI 還在發(fā)展

      在張鈸看來(lái),既然深度學(xué)習(xí)在根子上就錯(cuò)了,那么技術(shù)改良也就很難徹底解決 AI 的根本性缺陷。正是這些缺陷決定了其應(yīng)用的空間被局限在特定的領(lǐng)域——大部分都集中在圖像識(shí)別、語(yǔ)音識(shí)別兩方面!肝铱戳艘幌,中國(guó)人工智能領(lǐng)域 20 個(gè)獨(dú)角獸 30 個(gè)準(zhǔn)獨(dú)角獸企業(yè),近 80% 都跟圖像識(shí)別或者語(yǔ)音識(shí)別有關(guān)系。」

      他表示,「只要選好合適的應(yīng)用場(chǎng)景,利用成熟的人工智能技術(shù)去做應(yīng)用,還有較大的空間。目前在學(xué)術(shù)界圍繞克服深度學(xué)習(xí)存在的問(wèn)題,正展開(kāi)深入的研究工作,希望企業(yè)界,特別是中小企業(yè)要密切注視研究工作的進(jìn)展,及時(shí)地將新技術(shù)應(yīng)用到自己的產(chǎn)品中。當(dāng)然像谷歌、BAT 這樣規(guī)模的企業(yè),他們都會(huì)去從事相關(guān)的研究工作,他們會(huì)把研究、開(kāi)發(fā)與應(yīng)用結(jié)合起來(lái)。」

      一直在給深度學(xué)習(xí)潑冷水的 Gary Marcus, 提出要為深度學(xué)習(xí)祛魅:「我不認(rèn)為我們就要放棄深度學(xué)習(xí)。相反,我們需要將它重新概念化:它不是一種萬(wàn)能藥,而僅僅是作為眾多工具中的一種,在這個(gè)世界上,就像我們還需要錘子、扳手和鉗子。」

      「深度學(xué)習(xí)只是目前人工智能技術(shù)的一部分,人工智能還有更大更寬的領(lǐng)域需要去研究,知識(shí)表示、不確定性處理、人機(jī)交互,等等一大片地方,不能說(shuō)深度學(xué)習(xí)就是人工智能!箯堚撜f(shuō)。

      另外,中科院自動(dòng)化研究所副所長(zhǎng)劉成林曾表示,「如今的 AI 熱潮其實(shí)主要依賴(lài)模式識(shí)別和深度學(xué)習(xí)的成功。深度學(xué)習(xí)的紅利將逐漸用盡,但 AI 的很多方向(感知、認(rèn)知、學(xué)習(xí)語(yǔ)言理解、機(jī)器人、混合智能、博弈等)還會(huì)繼續(xù)發(fā)展,總體上不會(huì)跌入深谷。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。