在科學(xué)家研究AI的時候,一般會試圖模仿大腦的運作來制造智能機器。在這個過程中,他們發(fā)現(xiàn)可以借助AI的力量來反向研究大腦的結(jié)構(gòu)。這一新興的AI技術(shù)被稱為“神經(jīng)AI(neuroAI)”。
試想一下,十年后,我們能夠通過下載的方式來讓大腦調(diào)用不同的AI模型,從而直接完成物體識別或者像AI一樣便捷地處理自然語言,就好像租用了一個更高效的大腦。實現(xiàn)這一切,只需要科學(xué)家們能夠利用AI打造出更精細的硅基大腦模型。到那時,作為人類的我們,看東西、感知世界的方式將變得與眾不同。
另外,神經(jīng)AI還能夠在工業(yè)、藝術(shù)創(chuàng)意、健康改善等領(lǐng)域大放異彩。比如,神經(jīng)AI通過生成正確的圖像和聲音,將幫助剛做完準(zhǔn)分子激光手術(shù)或人工耳蝸植入手術(shù)的人更快恢復(fù)視力或聽力,甚至幫助醫(yī)療衛(wèi)生領(lǐng)域?qū)崿F(xiàn)新的突破。這些創(chuàng)新還將有益于其他新技術(shù)的發(fā)展,如增強現(xiàn)實(AR)與腦機接口(BCI)將會因此變得更加強大。
在這篇文章中,你將會了解什么是神經(jīng)AI,它將如何進化并開始影響我們的生活、如何支撐其他創(chuàng)新與技術(shù)的發(fā)展,以及我們還需要做些什么來推動它更好發(fā)展。
每期監(jiān)測和精編中文視野之外的全球高價值情報,為你提供先人一步洞察機會的新鮮資訊,為你提供升級思維方式的深度內(nèi)容,是為[ 紅杉匯內(nèi)參 ]。
什么是神經(jīng)AI?
神經(jīng)AI是一門新興學(xué)科,旨在:1)通過研究人的大腦來促進AI技術(shù)發(fā)展;2)利用AI來更好地研究人的大腦。神經(jīng)AI的核心工具之一是使用人工神經(jīng)網(wǎng)絡(luò)來創(chuàng)建特定大腦功能的計算機模型。這種方法始于2014年,當(dāng)時麻省理工學(xué)院和哥倫比亞大學(xué)的研究人員發(fā)現(xiàn),深度人工神經(jīng)網(wǎng)絡(luò)可以解釋大腦的物體識別區(qū)域——顳下皮層(IT)的反應(yīng)過程。于是他們引入了一個基本的實驗方法:將人工神經(jīng)網(wǎng)絡(luò)與大腦進行比較。然后反復(fù)迭代測試各種大腦反應(yīng)過程:形狀識別、運動處理、語音處理、手臂控制、空間記憶等,并相應(yīng)建立各個反應(yīng)對應(yīng)的大腦處理模型。
1. 訓(xùn)練硅基人工神經(jīng)網(wǎng)絡(luò)來解決如物體識別之類任務(wù)。由此產(chǎn)生的網(wǎng)絡(luò)被稱為任務(wù)向神經(jīng)網(wǎng)絡(luò)。重點是,它通常只需要圖像、影片和聲音來訓(xùn)練模型,而不需要大腦數(shù)據(jù)。
2. 使用如線性回歸或表征相似性分析之類的統(tǒng)計分析法,來比較訓(xùn)練后的人工神經(jīng)網(wǎng)絡(luò)的中間激活值與真實的大腦數(shù)值。
3.選擇表現(xiàn)*的模型作為當(dāng)前大腦區(qū)域的*模型。
該方法中的真實大腦數(shù)據(jù),可通過單個神經(jīng)元獲得,或以非侵入性技術(shù)如腦磁圖(MEG)或功能性磁共振成像(fMRI)來收集大腦內(nèi)部數(shù)據(jù)。
大腦部分區(qū)域的神經(jīng)AI模型有兩個關(guān)鍵特征。首先它是可計算的——給這個計算機模型提供刺激變量,它將能算出相應(yīng)的大腦區(qū)域會如何反應(yīng)。其次它也是可微分的——它是一個深度神經(jīng)網(wǎng),我們可以運用和研究視覺識別與自然語言處理模型相同的方式進行優(yōu)化。也就是說,神經(jīng)科學(xué)家可以借助所有推動深度學(xué)習(xí)革命的強大工具來更好做研究,包括PyTorch和TensorFlow等張量代數(shù)系統(tǒng)。
這意味著,我們將實現(xiàn)巨大的技術(shù)跨越——從不了解大腦的大部分運作機理,到能做出可下載的部分區(qū)域的模型。
神經(jīng)AI的應(yīng)用領(lǐng)域
藝術(shù)和廣告
我們感知各種媒體,99%是通過眼睛和耳朵。眼睛和耳朵本身并不負責(zé)解釋體驗,它們只是傳感器:是我們的大腦在處理和理解這些信息。面對不同的傳媒內(nèi)容,我們大腦會根據(jù)我們的所見所聞解析出不同的思考與情感,但是被解析出的結(jié)果,不一定是創(chuàng)作者想要傳達的、被受眾接受的。
所以,如果想要確定一個作品中預(yù)留的信息是否如預(yù)期那樣被受眾接收,就需要不斷地測試。一些互聯(lián)網(wǎng)公司中,比較流行的解決辦法是使用“A/B測試”。比如,谷歌曾測試過50種不同深淺的藍色用在顯示搜索結(jié)果的超鏈接上,最終他們找到的*解使谷歌的收入比基線提高了2億美元,約占當(dāng)時谷歌收入的1%;Netflix會為用戶調(diào)整影片縮略圖以優(yōu)化用戶體驗。
但是,如果我們能在不經(jīng)過大流量測試,未獲得任何測試數(shù)據(jù)之前就能預(yù)測人們對某一媒體的反應(yīng)呢?那樣,企業(yè)就能在未獲得太多關(guān)注之前更好地優(yōu)化其書面材料和網(wǎng)站。神經(jīng)AI在預(yù)測人們對視覺材料的反應(yīng)方面已經(jīng)做得越來越好。例如,Adobe的研究人員就正在研究相關(guān)的視覺設(shè)計工具,幫助設(shè)計人員更好地預(yù)測和引導(dǎo)人們的注意力。例如,通過編輯照片,使其在視覺上更令人難忘或更具美感。
另外,人工神經(jīng)網(wǎng)絡(luò)甚至可以找到比現(xiàn)實圖像更有效地傳達信息的方法。OpenAI的CLIP工具便可以幫助你找到與想要傳達的情感相一致的圖像;再比如OpenAI和谷歌,可以根據(jù)文字提示生成逼真的圖像。
目前在優(yōu)化視聽媒體、網(wǎng)站,尤其是廣告方面存在巨大的市場需求,而我們其實早就已經(jīng)開始將神經(jīng)AI和算法藝術(shù)引入這一過程了。巨大的市場需求會催生良性的發(fā)展循環(huán),隨著越來越多的資源被投入到實際應(yīng)用中,神經(jīng)AI也將變得更好、更有用。作為副產(chǎn)品,因為獲得了更好的大腦模型,廣告以外的其他領(lǐng)域也將能一起受益。
可及性與算法設(shè)計
神經(jīng)AI最令人興奮的應(yīng)用之一是提高產(chǎn)品的可及性。
大多數(shù)媒體其實是為“一般普通人”設(shè)計的,然而每個人處理視聽信息的方式卻各不相同。比如有色盲困擾的人群和一般人群的信息處理方式是不同的,因此大量的媒體并不適合他們。雖然如今有不少產(chǎn)品可以模擬色盲效果,但需要一個色覺正常的人先為產(chǎn)品做解釋,然后才能去做相應(yīng)的調(diào)整改變。直接做靜態(tài)的顏色重映射無法滿足他們需求,是因為有些材料在顏色重映射后語義會發(fā)生變化(例如,圖表會變得難以讀懂)。但有了神經(jīng)AI之后,我們就可以在保持現(xiàn)有圖形語義的情況下,自動生成適合色盲閱讀的材料和網(wǎng)站。
另一個例子是,幫助有學(xué)習(xí)障礙的人,如閱讀障礙人群。閱讀障礙的一個深層原因是對擁擠十分敏感,因此難以識別具有相似基本特征的形狀。而麻省理工學(xué)院正在研究一種閱讀障礙者的視覺系統(tǒng)神經(jīng)AI模型,可以幫助設(shè)計既美觀又能讓他們順利閱讀的字體。這些都是潛在的、亟待實現(xiàn)的生活質(zhì)量的巨大改善。
健康
許多神經(jīng)科學(xué)家在進入這一領(lǐng)域時,都希望自己的研究能對人類健康產(chǎn)生積極影響,特別是對患有神經(jīng)系統(tǒng)疾病或精神健康問題的人。利用神經(jīng)AI模型,有機會開啟新的療法——獲得優(yōu)良的大腦模型后,便可以精心設(shè)計正確的刺激,來傳遞相應(yīng)的信息,就像鑰匙和鎖的匹配一樣。從這個意義上說,神經(jīng)AI的應(yīng)用類似于算法藥物設(shè)計,但我們在人體內(nèi)釋放的不是藥物小分子,而是圖像和聲音。
眼睛和耳朵的感受器方面的問題是最有可能先被解決的,因為這些感受器目前已經(jīng)有了很好的建模。比如人工耳蝸植入手術(shù)可以在神經(jīng)AI大腦模型的幫助下,優(yōu)化植入物的刺激模式,放大語音來優(yōu)化助聽效果。
許多人在一生中都會經(jīng)歷感官系統(tǒng)的變化,比如近視。在變化之后,人會通過不斷學(xué)習(xí)來讓大腦重新適應(yīng)這個世界,更好地理解新的知覺信息,這種現(xiàn)象稱為知覺學(xué)習(xí)。神經(jīng)AI能夠放大這種知覺學(xué)習(xí),讓人們能更快更有效地恢復(fù)感知技能。類似的,還有通過神經(jīng)AI技術(shù)幫助那些在中風(fēng)后失去流暢移動四肢能力的人;優(yōu)化健康人類的感官體驗——比如輔助棒球運動員、弓箭手或病理學(xué)家的訓(xùn)練等。
最后,我們發(fā)現(xiàn)這些技術(shù)在情緒障礙的治療方面也能大有所為。我們可以通過感官體驗來治療情緒障礙。比如我們知道,用電刺激控制大腦特定部位的活動可以緩解“頑固型抑郁癥”(treatment-resistant depression),有了神經(jīng)AI后,或許通過感官間接控制大腦的活動也可以獲得類似的效果。
增強現(xiàn)實
一個將使神經(jīng)AI應(yīng)用變得更加強大的技術(shù)是AR眼鏡。因為可以*融入到我們的日常生活中,AR技術(shù)具備著成為無處不在的計算平臺的潛力。眾多科技巨頭、互聯(lián)網(wǎng)巨頭都在加快步伐研究更高階的AR眼睛,所以在供應(yīng)方面就已經(jīng)有巨大的推動力在助推其發(fā)展。而這將使人們廣泛使用上一種比今天的靜態(tài)屏幕強大得多的顯示設(shè)備。
如果參照VR設(shè)備的發(fā)展軌跡,它最終還會將眼球追蹤功能集成進來。也就是說,我們可以遠遠超越目前可能的技術(shù)手段,以更可控的方式實現(xiàn)更廣泛的視覺刺激。另外這些設(shè)備在健康領(lǐng)域也將具有非常深遠的應(yīng)用前景。
腦機接口(BCI)
有了出色的顯示器(圖像)和揚聲器(聲音),我們可以精確控制大腦的主要輸入信號。而通過感官傳遞刺激的下一個更強大的階段,是通過只讀的腦機接口(BCI)驗證大腦是否以預(yù)期的方式做出反應(yīng)。如此一來,我們便可以評估刺激對大腦的影響,如果不符合預(yù)期,還可以在所謂的閉環(huán)控制中做相應(yīng)的調(diào)整。
我們并不需要在顱內(nèi)植入芯片或者深層腦刺激器,因為這樣簡單的評估,在顱外以非侵入性的方式測量大腦活動已經(jīng)足夠了。我們也不需要通過BCI直接刺激大腦,眼鏡和耳機就能控制大腦的大部分輸入。目前,有許多非侵入性只讀BCI已經(jīng)商業(yè)化或正在籌備中,可用于閉環(huán)控制。一些例子包括:
•腦電圖(EEG)。腦電圖測量的是顱骨外的大腦電活動。由于頭骨相當(dāng)于一個容積導(dǎo)體,因此腦電圖的時間分辨率很高,但空間分辨率很低。當(dāng)我們獲得了刺激的控制權(quán),腦電圖便能發(fā)揮更強大的作用——比如可以將刺激與腦電圖信號關(guān)聯(lián)起來,然后解碼什么刺激能吸引注意力(誘發(fā)電位法)。
•功能性磁共振成像(fMRI)。fMRI測量的是與神經(jīng)活動相關(guān)的血氧含量的微小變化,它是*能夠以空間上精確的方式非侵入性地讀取大腦深處活動的技術(shù)。對于閉環(huán)神經(jīng)控制方面來說,有兩種范式相對成熟。*種是基于fMRI的生物反饋;第二種是皮質(zhì)圖譜。這兩種方法都表明,想要評估神經(jīng)AI對大腦的刺激效果完全是有可能的。
•近紅外腦功能成像(fNIRS)。fNIRS通過漫射光來測量發(fā)射器與接收器之間的腦血容量。傳統(tǒng)的近紅外成像的空間分辨率較低,但通過時間門控(TD-NIRS)和大規(guī)模超采樣(漫反射光學(xué)斷層成像),空間分辨率會有一定提升。在學(xué)術(shù)方面,WUSTL的Joe Culver小組已經(jīng)實現(xiàn)了對視覺皮層的影片解碼。而在商業(yè)方面,Kernel現(xiàn)在正在制造和銷售TD-NIRS頭盔,這是十分驚人的工程壯舉。這是一個人們不斷推動的領(lǐng)域,而且進展迅速。
•腦磁圖(MEG)。腦磁圖通過測量磁場的微小變化來定位大腦活動。MEG與EEG類似,它測量電磁場的變化,但它可以不受容積導(dǎo)體的影響,因此具有更好的空間分辨率。人們在光泵磁強計(optically pumped magnetometers,OPM)方面也正不斷取得進展,將來我們將有可能在公開市場上購買單個OPM傳感器。
除了這些比較知名的技術(shù)外,一些黑馬技術(shù),如數(shù)字全息技術(shù)(digital holography)、光聲斷層掃描技術(shù)(photo-acoustic tomography)和功能性超聲技術(shù)(functional ultrasound),則可能會極大加速這一領(lǐng)域的范式轉(zhuǎn)變。
雖然消費級的非侵入式BCI仍處于起步階段,但圍繞著AR用例的旺盛需求將不斷推動市場將蛋糕做大。我們可能會看到低維BCI的迅速發(fā)展,上面提及的各種神經(jīng)AI應(yīng)用就很有可能成為真正的現(xiàn)實。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。