繼續(xù)見證5G+AI成長(zhǎng),進(jìn)博會(huì)全勤生高通確認(rèn)明年第八次參展來(lái)采銷直播間看京東11.11外設(shè)辦公總裁直播 11日14點(diǎn)準(zhǔn)時(shí)開播第七屆進(jìn)博會(huì)盤點(diǎn):高通攜手伙伴展示的驍龍8至尊版旗艦終端備受關(guān)注產(chǎn)業(yè)合作推動(dòng)AI發(fā)展 高通孟樸:攜手伙伴共抓5G+AI新機(jī)遇進(jìn)博會(huì)看技術(shù)變化,從5G手機(jī)到AI終端,高通技術(shù)支持行業(yè)拓展    高通獲頒“2024新消費(fèi)創(chuàng)新案例”,5G-A推動(dòng)數(shù)字消費(fèi)高質(zhì)量發(fā)展3G追趕,4G并行,5G趕超!高通孟樸進(jìn)博會(huì)談與中國(guó)伙伴合作歷程京東11.11巔峰28小時(shí)倒計(jì)時(shí) 爆款耳機(jī)音箱5折開搶手機(jī)內(nèi)卷下一站,AI Agent消息稱著名 AI 學(xué)者、天工智能首席科學(xué)家顏水成離開昆侖萬(wàn)維昆侖萬(wàn)維SkyReels AI短劇平臺(tái)將于12月10日在美國(guó)正式上線韓國(guó)今年進(jìn)口柴油車銷量預(yù)計(jì)跌破 1 萬(wàn)輛,創(chuàng)近 17 年新低讓游戲黨一秒種草的大屏電視?海信這款百吋旗艦做到了!為用戶節(jié)省超120萬(wàn)元 京東11.11攜手奔圖加速打印國(guó)產(chǎn)化進(jìn)程京東3C數(shù)碼“瘋狂星期一”驚喜放價(jià) TP-LINK攝像頭限時(shí)直降210元11月9日晚8點(diǎn)京東11.11火熱開啟!潮流配件9.9元起京東11.11最后一波Apple大放價(jià) iPhone 16 Pro系列持續(xù)加補(bǔ)1600元2024 ROG DAY狂歡啟航,ROG電競(jìng)顯示器助力三大戰(zhàn)車燃爆鄭州站!來(lái)京東11.11一次性搞定視頻、音頻等APP會(huì)員充值 省錢又省心歐萊雅中國(guó)"FUN YOUniverTH有意思青年"創(chuàng)變盛典耀動(dòng)進(jìn)博會(huì)
  • 首頁(yè) > 企業(yè)IT頻道 > 數(shù)字化

    計(jì)算機(jī)視覺(jué)技術(shù)即將迎來(lái)重大轉(zhuǎn)變

    2022年09月15日 20:15:32   來(lái)源:千家網(wǎng)

      本文作者:Sally Ward-Foxton

      計(jì)算機(jī)視覺(jué)是否會(huì)再次自我改造?

      匹茲堡大學(xué)眼科教授、CMU 機(jī)器人研究所兼職教授 Ryad Benosman 認(rèn)為確實(shí)如此。作為基于事件的視覺(jué)技術(shù)的創(chuàng)始人之一,Benosman 預(yù)計(jì)神經(jīng)形態(tài)視覺(jué)——基于基于事件的相機(jī)的計(jì)算機(jī)視覺(jué)——將成為計(jì)算機(jī)視覺(jué)的下一個(gè)方向。

      “計(jì)算機(jī)視覺(jué)已經(jīng)被重新發(fā)明了很多很多次,” Benosman說(shuō)。“我已經(jīng)看到它至少重新發(fā)明了兩次。”

      Benosman 提到了 1990 年代從帶有一點(diǎn)攝影測(cè)量的圖像處理到基于幾何的方法的轉(zhuǎn)變,然后是今天機(jī)器學(xué)習(xí)的快速發(fā)展。盡管發(fā)生了這些變化,現(xiàn)代計(jì)算機(jī)視覺(jué)技術(shù)仍然主要基于圖像傳感器——產(chǎn)生類似于人眼所見圖像的相機(jī)。

      根據(jù) Benosman 的說(shuō)法,在圖像傳感范式不再有用之前,它會(huì)阻礙替代技術(shù)的創(chuàng)新。高性能處理器(例如 GPU)的發(fā)展推遲了尋找替代解決方案的需要,因此延長(zhǎng)了這種影響。

      “我們?yōu)槭裁磳D像用于計(jì)算機(jī)視覺(jué)?這是一個(gè)價(jià)值百萬(wàn)美元的問(wèn)題,”他說(shuō)。“我們沒(méi)有理由使用圖像——這只是因?yàn)闅v史的動(dòng)力。甚至在沒(méi)有相機(jī)之前,圖像就有動(dòng)力。”圖像相機(jī)

      自從公元前五世紀(jì)針孔相機(jī)出現(xiàn)以來(lái),圖像相機(jī)就一直存在到 1500 年代,藝術(shù)家們使用房間大小的設(shè)備將房間外的人或風(fēng)景的圖像追蹤到畫布上。多年來(lái),這些畫被替換為膠片來(lái)記錄圖像。數(shù)碼攝影等創(chuàng)新最終使圖像相機(jī)很容易成為現(xiàn)代計(jì)算機(jī)視覺(jué)技術(shù)的基礎(chǔ)。

      然而,Benosman 認(rèn)為,基于圖像相機(jī)的計(jì)算機(jī)視覺(jué)技術(shù)效率極低。他的比喻是中世紀(jì)城堡的防御系統(tǒng):位于城墻周圍的衛(wèi)兵四處尋找接近的敵人。鼓手穩(wěn)定地敲打,每一個(gè)鼓點(diǎn),每個(gè)守衛(wèi)都會(huì)大聲喊出他們所看到的。在一片喧嘩中,聽到一個(gè)守衛(wèi)在遙遠(yuǎn)的森林邊緣發(fā)現(xiàn)敵人是多么容易?

      21 世紀(jì)的鼓點(diǎn)硬件等價(jià)物是電子時(shí)鐘信號(hào),而守衛(wèi)是像素。大量數(shù)據(jù)被創(chuàng)建并且必須在每個(gè)時(shí)鐘周期進(jìn)行檢查,這會(huì)導(dǎo)致大量冗余信息,從而需要大量不必要的計(jì)算。

      “人們正在燃燒如此多的能量,它占用了城堡的整個(gè)計(jì)算能力來(lái)保護(hù)自己,” Benosman說(shuō)。如果發(fā)現(xiàn)了一個(gè)有趣的事件——在這個(gè)類比中以敵人為代表——“你必須四處走動(dòng)收集無(wú)用的信息,人們到處尖叫,所以帶寬很大……現(xiàn)在想象你有一座復(fù)雜的城堡。所有這些人都必須被聽到。”

      進(jìn)入神經(jīng)形態(tài)視覺(jué)。基本思想受到生物系統(tǒng)工作方式的啟發(fā),即檢測(cè)場(chǎng)景動(dòng)態(tài)的變化,而不是連續(xù)分析整個(gè)場(chǎng)景。在我們的城堡類比中,這意味著讓守衛(wèi)保持安靜,直到他們看到感興趣的東西,然后喊出他們的位置以發(fā)出警報(bào)。在電子版中,這意味著讓單個(gè)像素確定他們是否看到相關(guān)的東西。

      “像素可以自行決定他們應(yīng)該發(fā)送什么信息,” Benosman說(shuō)。

      “他們可以尋找有意義的信息——特征,而不是獲取系統(tǒng)信息。這就是與眾不同的地方。”

      Prophesee 與索尼合作開發(fā)的 DVS 傳感器評(píng)估套件。Benosman 是 Prophesee 的聯(lián)合創(chuàng)始人。(來(lái)源:Prophesee)

      與固定頻率的系統(tǒng)采集相比,這種基于事件的方法可以節(jié)省大量功率并減少延遲。

      “你想要一些更具適應(yīng)性的東西,這就是[基于事件的視覺(jué)]的相對(duì)變化給你的東西——適應(yīng)性采集頻率,”他說(shuō)。“當(dāng)你觀察幅度變化時(shí),如果某些東西移動(dòng)得非?,我們就會(huì)得到很多樣本。如果某些東西沒(méi)有改變,你會(huì)得到幾乎為零,所以你正在根據(jù)場(chǎng)景的動(dòng)態(tài)調(diào)整你的采集頻率。這就是它帶來(lái)的東西。這就是為什么它是一個(gè)好的設(shè)計(jì)。”

      Benosman 于 2000 年進(jìn)入神經(jīng)形態(tài)視覺(jué)領(lǐng)域,他堅(jiān)信先進(jìn)的計(jì)算機(jī)視覺(jué)永遠(yuǎn)無(wú)法發(fā)揮作用,因?yàn)閳D像不是正確的方法。

      “最大的轉(zhuǎn)變是說(shuō)我們可以在沒(méi)有灰度和沒(méi)有圖像的情況下進(jìn)行視覺(jué),這在 2000 年底是異端——完全是異端,”他說(shuō)。

      Benosman 提出的技術(shù)——今天基于事件的傳感的基礎(chǔ)——是如此不同,以至于提交給當(dāng)時(shí)最重要的 IEEE 計(jì)算機(jī)視覺(jué)期刊的論文在未經(jīng)審查的情況下被拒絕。事實(shí)上,直到 2008 年動(dòng)態(tài)視覺(jué)傳感器 (DVS) 的開發(fā),該技術(shù)才開始獲得動(dòng)力。 神經(jīng)科學(xué)靈感

      神經(jīng)形態(tài)技術(shù)是受生物系統(tǒng)啟發(fā)的技術(shù),包括終極計(jì)算機(jī):大腦及其神經(jīng)元,或計(jì)算元素。問(wèn)題是沒(méi)有人完全理解神經(jīng)元是如何工作的。雖然我們知道神經(jīng)元對(duì)傳入的稱為尖峰的電信號(hào)起作用,但直到最近,研究人員仍將神經(jīng)元描述為相當(dāng)草率,認(rèn)為只有尖峰的數(shù)量很重要。這個(gè)假設(shè)持續(xù)了幾十年,但最近的工作證明,這些尖峰的時(shí)間是絕對(duì)關(guān)鍵的,并且大腦的結(jié)構(gòu)會(huì)在這些尖峰中產(chǎn)生延遲來(lái)編碼信息。

      今天的尖峰神經(jīng)網(wǎng)絡(luò)模擬大腦中看到的尖峰信號(hào),是真實(shí)事物的簡(jiǎn)化版本——通常是尖峰的二進(jìn)制表示。“我收到一個(gè) 1,我醒來(lái),我計(jì)算,我睡覺(jué),”Benosman 解釋說(shuō),F(xiàn)實(shí)要復(fù)雜得多。當(dāng)尖峰到來(lái)時(shí),神經(jīng)元開始隨著時(shí)間的推移對(duì)尖峰的值進(jìn)行積分;神經(jīng)元也有泄漏,這意味著結(jié)果是動(dòng)態(tài)的。此外,大約有 50 種不同類型的神經(jīng)元具有 50 種不同的集成配置文件。

      當(dāng)前的電子版本缺少集成的動(dòng)態(tài)路徑、神經(jīng)元之間的連接性以及不同的權(quán)重和延遲。“問(wèn)題在于,要制造出有效的產(chǎn)品,你不能[模仿]所有的復(fù)雜性,因?yàn)槲覀儾焕斫馑?rdquo;他說(shuō)。“如果我們有好的大腦理論,我們就會(huì)解決它。問(wèn)題是,我們只是不知道。”

      Bensoman 經(jīng)營(yíng)著一個(gè)獨(dú)特的實(shí)驗(yàn)室,致力于了解皮層計(jì)算背后的數(shù)學(xué)原理,旨在創(chuàng)建新的數(shù)學(xué)模型并將其復(fù)制為硅設(shè)備。這包括直接監(jiān)測(cè)來(lái)自真實(shí)視網(wǎng)膜的尖峰。

      目前, Bensoman反對(duì)忠實(shí)地復(fù)制生物神經(jīng)元,稱這種方法是過(guò)時(shí)的。

      “在硅中復(fù)制神經(jīng)元的想法的產(chǎn)生是因?yàn)槿藗冇^察了晶體管并看到了一個(gè)看起來(lái)像真正神經(jīng)元的機(jī)制,所以一開始它背后有一些想法,”他說(shuō)。“我們沒(méi)有細(xì)胞;我們有硅。你需要適應(yīng)你的計(jì)算基板,而不是相反……如果我知道我在計(jì)算什么并且我有芯片,我可以優(yōu)化這個(gè)方程式并以最低的成本、最低的功耗、最低的延遲運(yùn)行它。” 處理能力

      無(wú)需精確復(fù)制神經(jīng)元這一認(rèn)識(shí)以及 DVS 相機(jī)的發(fā)展是當(dāng)今視覺(jué)系統(tǒng)背后的驅(qū)動(dòng)力。雖然系統(tǒng)已經(jīng)上市,但在完全類似于人類的視覺(jué)可用于商業(yè)用途之前,還需要取得進(jìn)展。

      Benosman 說(shuō),最初的 DVS 相機(jī)具有“大而粗的像素”,因?yàn)楣怆姸䴓O管本身周圍的組件大大降低了填充因子。雖然對(duì)開發(fā)這些攝像機(jī)的投資加速了這項(xiàng)技術(shù),但貝諾斯曼明確表示,今天的事件攝像機(jī)只是對(duì)早在 2000 年開發(fā)的原始研究設(shè)備的改進(jìn)。索尼最先進(jìn)的 DVS 攝像機(jī),三星和 Omnivision 擁有微小的像素,融合了 3D 堆疊等先進(jìn)技術(shù)并降低了噪點(diǎn)。Benosman 擔(dān)心的是今天使用的傳感器類型能否成功擴(kuò)大規(guī)模。

      “問(wèn)題是,一旦你增加像素?cái)?shù)量,你就會(huì)得到大量數(shù)據(jù),因?yàn)槟愕乃俣热匀环浅?欤?rdquo;他說(shuō)。“你可能仍然可以實(shí)時(shí)處理它,但是你會(huì)從太多的像素中得到太多的相對(duì)變化。這現(xiàn)在正在殺死所有人,因?yàn)樗麄兛吹搅藵摿Γ麄儧](méi)有合適的處理器來(lái)支持它。” 這個(gè) Prophesee 客戶應(yīng)用示例顯示了圖像攝像頭(每個(gè)框的左上角)和 DVS 傳感器輸出之間的差異。(來(lái)源:Prophesee)

      通用神經(jīng)形態(tài)處理器落后于 DVS 相機(jī)對(duì)應(yīng)物。一些業(yè)內(nèi)最大的參與者(IBM Truenorth、英特爾 Loihi)的努力仍在進(jìn)行中。Benosman 表示,正確的處理器和正確的傳感器將是無(wú)與倫比的組合。

      “[今天的 DVS] 傳感器速度極快,帶寬超低,動(dòng)態(tài)范圍大,因此您可以在室內(nèi)和室外看到,”Benosman 說(shuō)。“這是未來(lái)。它會(huì)起飛嗎?絕對(duì)地。”

      “誰(shuí)能把處理器放在那里并提供完整的堆棧,誰(shuí)就贏了,因?yàn)樗鼘⑹菬o(wú)與倫比的,”他補(bǔ)充道。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。