CV (計(jì)算機(jī)視覺)在 AI 中大概的位置我用這一張圖來表現(xiàn),其實(shí)我標(biāo)不同的方塊的顏色代表這個(gè)領(lǐng)域商業(yè)化的成熟度,這里語(yǔ)音和視覺是更接近商業(yè)化落地的,NLP和通用人工智能還有很長(zhǎng)的路要走。
CV今天非;馃崾且?yàn)樗蟹浅6嗟膽?yīng)用,從互聯(lián)網(wǎng)、安防、無人車、機(jī)器人到AR、VR等等,也允許大公司和創(chuàng)業(yè)公司在整個(gè)市場(chǎng)上并存。
做CV的話需要什么呢?既需要理論也需要?jiǎng)?chuàng)新,這里分享一下:上周日曠視科技成立了學(xué)術(shù)委員會(huì),非常有幸請(qǐng)到了圖靈獎(jiǎng)唯一一位華人得主姚期智先生擔(dān)任學(xué)術(shù)委員會(huì)首席顧問,幫我們?cè)诶碚摲矫姘殃P(guān)。
今天我會(huì)分享一下算法上面的工作。
計(jì)算方式的變革(或復(fù)興):神經(jīng)網(wǎng)絡(luò)計(jì)算突破馮·諾依曼結(jié)構(gòu)的體系瓶頸
在講計(jì)算機(jī)視覺之前,我想先講一下對(duì)算法尤其是計(jì)算的理解。我們今天用的計(jì)算機(jī)還是馮·諾依曼結(jié)構(gòu)的計(jì)算機(jī),它的計(jì)算機(jī)體系結(jié)構(gòu)設(shè)計(jì)的思想是要把數(shù)據(jù)和程序同時(shí)放在內(nèi)存里,好處是程序遇到不同的數(shù)據(jù)時(shí)可以改變程序,可以自適應(yīng)地處理數(shù)據(jù),這非常了不起,因?yàn)樵谶@之前,如果不這樣的話,每一次不管是插線還是打孔,都很難去重新編程。后來圖靈也問了個(gè)問題:既然機(jī)器可以根據(jù)自動(dòng)處理數(shù)據(jù),那是不是機(jī)器就可以擁有智能。
但是今天我們用了很長(zhǎng)時(shí)間的馮·諾依曼結(jié)構(gòu),很大一個(gè)局限是它有一個(gè)瓶頸:學(xué)術(shù)界叫做馮·諾依曼瓶頸,其實(shí)是說CPU和內(nèi)存之間的帶寬是不夠的。雖然 CPU 可以加速,但是數(shù)據(jù)越來越大,就會(huì)堵在中間。怎么去突破這一個(gè)瓶頸,目前的傳統(tǒng)計(jì)算機(jī)結(jié)構(gòu)是不能突破這一瓶頸的。
而我們大腦其實(shí)不是這樣的結(jié)構(gòu),大腦里面所有的計(jì)算和表示都是在一個(gè)并行的網(wǎng)絡(luò)里面運(yùn)行的。
這跟我們今天做的神經(jīng)網(wǎng)絡(luò)也非常類似,這是神經(jīng)網(wǎng)絡(luò)的一個(gè)神經(jīng)元或者多個(gè)神經(jīng)元在做的一些處理,右邊是人腦神經(jīng)元的一些類別,基本上一個(gè)神經(jīng)元會(huì)接受相連接的幾百個(gè)、上千個(gè)神經(jīng)元來的輸入,然后做一個(gè)決策:神經(jīng)元到底是激活還是不激活。
所以如果我們看今天神經(jīng)網(wǎng)絡(luò)的計(jì)算是在做什么呢?其實(shí)是在通過一個(gè)函數(shù)把一個(gè)高維激活向量變成另外一個(gè)高維激活向量。我們目前的神經(jīng)網(wǎng)絡(luò)就是不停做這樣的變換,做一次、兩次,做很多次,以至于形成一個(gè)非常復(fù)雜的嵌套變換,這就是我們今天的神經(jīng)網(wǎng)絡(luò)。
我們可以把它拆成三個(gè)因素,一個(gè)是表示這樣的激活向量,還有里面的標(biāo)量非線性,還有權(quán)重矩陣,這是里面的三要素。激活向量其實(shí)是知識(shí)的表示,非線性是來表示這個(gè)神經(jīng)元是激活還是不激活,這權(quán)重矩陣是通過監(jiān)督學(xué)習(xí)到的知識(shí)。
這一個(gè)方式有很多好的特性,比如說它是高度并行,內(nèi)存帶寬可以非常大,還有一個(gè)優(yōu)點(diǎn)就是計(jì)算非常簡(jiǎn)單,基本上就是矩陣乘,沒有有分枝判斷,沒有馮·諾依曼結(jié)構(gòu)下的復(fù)雜計(jì)算,所以這一種計(jì)算在一定意義上可以突破馮·諾依曼結(jié)構(gòu)的體系瓶頸,比如說右側(cè)是今天神經(jīng)網(wǎng)絡(luò)的主要模式,左邊是以前的模式,可以看到計(jì)算可以提高帶寬10倍甚至上百倍。
這樣的計(jì)算,現(xiàn)在還有NVIDIA、AMD的GPU這樣的并行處理單元來加速,大家可以看到這個(gè)數(shù)字,120個(gè)TFLOP/S,這是今天 NVIDIA最好的顯卡能做到的計(jì)算力。大家可以比較一下去年GPU的顯卡還是Pascal 系列,是10個(gè)TFLOP/S,今年不管是 NVIDIA還是谷歌第二代的TPU,計(jì)算量提高了10倍、甚至20倍,這遠(yuǎn)遠(yuǎn)打破了摩爾定律,這是在訓(xùn)練端或者服務(wù)器端。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。
近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。