人工智能的邊界和挑戰(zhàn)是什么?現(xiàn)在走到了哪里,又該向何處去?5月24日-25日在成都舉辦的CCF年度盛會——2019 CCF青年精英大會(YEF 2019)上,人工智能領(lǐng)域?qū)<覀冋归_了討論,中國科學(xué)院張鈸院士給出的答案是“人工智能剛剛起步,現(xiàn)在離起點不遠(yuǎn),人工智能之路還很長,并且永遠(yuǎn)在路上。”
雖然人工智能技術(shù)的行業(yè)應(yīng)用越來越廣泛,仿佛真的站在風(fēng)口準(zhǔn)備擁抱下一場革命,但正如專家們所言,對于人工智能的發(fā)展,應(yīng)該保持謹(jǐn)慎的樂觀態(tài)度。當(dāng)前人工智能還面臨諸多挑戰(zhàn),例如數(shù)據(jù)孤島問題、隱私保護(hù)問題、安全問題、如何從感知智能發(fā)展到認(rèn)知智能再到更遠(yuǎn)的讓機(jī)器擁有自我認(rèn)知等等,突破這些瓶頸,或許才是人工智能走得更遠(yuǎn)的關(guān)鍵。
其中數(shù)據(jù)孤島和隱私保護(hù)問題是當(dāng)前人工智能大規(guī)模產(chǎn)業(yè)化應(yīng)用過程中遇到的突出問題。對此,人工智能國際專家、微眾銀行首席人工智能官楊強(qiáng)教授在大會上發(fā)表了題為《用戶隱私,數(shù)據(jù)孤島和聯(lián)邦遷移學(xué)習(xí)》的特邀報告,他的答案是:開展新一代的人工智能算法研究,突破數(shù)據(jù)孤島和小數(shù)據(jù)的限制,同時保護(hù)數(shù)據(jù)安全和用戶隱私。這個答案的背后是一項新的領(lǐng)先全球的技術(shù),叫做“聯(lián)邦遷移學(xué)習(xí)。”
大數(shù)據(jù)時代并未真正到來,小數(shù)據(jù)和數(shù)據(jù)孤島林立
楊強(qiáng)教授指出,人工智能發(fā)展離不開大數(shù)據(jù),人工智能技術(shù)如果是火箭引擎,大數(shù)據(jù)就是燃料,但是數(shù)據(jù)量的激增并不意味著真正的“大數(shù)據(jù)”時代到來。多數(shù)行業(yè)中是數(shù)據(jù)質(zhì)量不高的“小數(shù)據(jù)”,是一個個數(shù)據(jù)孤島,數(shù)據(jù)割裂嚴(yán)重。
例如在法律領(lǐng)域,如果想得到一個非常好的樣本,需要經(jīng)歷很長的鏈條,經(jīng)過很長時間,有法官、律師等多方參與,才能把一個樣本標(biāo)注好,這導(dǎo)致有標(biāo)注的高質(zhì)量數(shù)據(jù)并不多,并且分散在各地的各級法院。而在醫(yī)療領(lǐng)域這種數(shù)據(jù)孤島更加嚴(yán)重,例如醫(yī)療影像往往分散在各個醫(yī)院。導(dǎo)致這種結(jié)果的原因很多,包括監(jiān)管原因、機(jī)構(gòu)各自的利益、流程制度限制等。
從遷移學(xué)習(xí)到聯(lián)邦學(xué)習(xí),打通數(shù)據(jù)孤島
能否從技術(shù)角度尋求解決方案?作為國際人工智能界“遷移學(xué)習(xí)”(transfer learning)領(lǐng)域的發(fā)起人和帶頭人,楊強(qiáng)教授從遷移學(xué)習(xí)中找尋問題的答案,首先想到通過知識遷移解決“小數(shù)據(jù)”問題。如果面臨的是“小數(shù)據(jù)”,就找到一個類似的“大數(shù)據(jù)”,舉一反三,幫助只有小數(shù)據(jù)的任務(wù)運用來自其他相關(guān)任務(wù)的大數(shù)據(jù),從而獲得更好的表現(xiàn),使得建立的模型能夠更可靠,魯棒性好,不受外界干擾,平穩(wěn)運行,這在人工智能落地的應(yīng)用上是非常重要的一個特性,同時也能夠防止隱私泄露。這種從源領(lǐng)域遷移到目標(biāo)領(lǐng)域的方式,在金融、工業(yè)、信息流推薦等領(lǐng)域都有應(yīng)用,例如貸款風(fēng)控策略在不同用戶類別間的遷移、推薦系統(tǒng)中推薦策略遷移、輿情分析系統(tǒng)中的關(guān)鍵詞遷移等。
雖然遷移學(xué)習(xí)可以有效解決“小數(shù)據(jù)”的問題,但是實際上現(xiàn)在面臨的不僅僅是“小數(shù)據(jù)”的問題,而是“數(shù)據(jù)割裂”、“數(shù)據(jù)孤島”。這不僅僅是技術(shù)的問題,不能通過簡單的數(shù)據(jù)整合(Data integration)解決,而是要克服政策、監(jiān)管、技術(shù)等多維度難題。此時“聯(lián)邦學(xué)習(xí)”(Federated Learning)提供了新的思路,讓多方參與,共同建模。
從聯(lián)邦學(xué)習(xí)到聯(lián)邦遷移學(xué)習(xí),保護(hù)數(shù)據(jù)隱私
打通數(shù)據(jù),共同建模,這本是一個美好的期望方向,但數(shù)據(jù)隱私保護(hù)的日益嚴(yán)格帶來了嚴(yán)峻挑戰(zhàn),歐盟數(shù)據(jù)隱私保護(hù)法GDPR(The General Data Protection Regulation )作為“史上最嚴(yán)厲”的數(shù)據(jù)隱私保護(hù)法案成為一個信號,全世界都在加強(qiáng)數(shù)據(jù)隱私保護(hù)方面的立法建設(shè),那么是否可以讓聯(lián)邦學(xué)習(xí)參與方只交換模型而不交換數(shù)據(jù)?讓數(shù)據(jù)不出本地,從而保護(hù)數(shù)據(jù)隱私?據(jù)楊教授介紹,數(shù)學(xué)家們提供了新思路——將同態(tài)加密技術(shù)(Homomorphic Encryption,HE)融入聯(lián)邦學(xué)習(xí),其核心思想并不復(fù)雜,假設(shè)A加B是一個公式里的兩項,對整個公式加密,那么HE就可以把它表達(dá)成對A的加密加上對B的加密。這樣可以讓參與方不上傳數(shù)據(jù),只上傳加密的算法模型參數(shù)而進(jìn)行共同建模,在這個過程中,即使通過多次交換,也不能重構(gòu)出另一方的數(shù)據(jù),真正實現(xiàn)數(shù)據(jù)不泄露。
在實際應(yīng)用中,有基于同一特征維度,不同用戶群體的“橫向聯(lián)邦”,例如谷歌的手機(jī)終端聯(lián)邦學(xué)習(xí),微眾銀行聯(lián)合多家銀行建立的反洗錢模型,以及針對同一用戶群體,不同特征維度的“縱向聯(lián)邦”,例如根據(jù)用戶在銀行的信用表現(xiàn)進(jìn)行個性化保險定價。除此以外,微眾銀行AI團(tuán)隊首次提出了“聯(lián)邦遷移學(xué)習(xí)”,將“聯(lián)邦學(xué)習(xí)”和“遷移學(xué)習(xí)”相結(jié)合,即使是在用戶群體和特征維度重合都小的情況下,也可以進(jìn)行合作,這意味著無論是政府機(jī)構(gòu)和金融機(jī)構(gòu)之間,還是互聯(lián)網(wǎng)機(jī)構(gòu)和金融機(jī)構(gòu)之間,或者是其他各領(lǐng)域之間,都可以實現(xiàn)跨界合作。
聯(lián)邦學(xué)習(xí)不僅是技術(shù)方向,更是社會問題
楊強(qiáng)教授提到,雖然有了技術(shù)工具,微眾銀行也對外開源了通用的聯(lián)邦學(xué)習(xí)框架平臺Federated AI Technology Enabler(FATE),但如何設(shè)立激勵機(jī)制吸引機(jī)構(gòu)進(jìn)入聯(lián)邦,形成良性生態(tài),則包含博弈論、機(jī)制設(shè)計、法律等多領(lǐng)域,聯(lián)邦學(xué)習(xí)不僅是能解決數(shù)據(jù)孤島和數(shù)據(jù)隱私保護(hù)的技術(shù)方向,更是一個復(fù)雜的社會協(xié)同治理問題。除了吸納更多企業(yè)加入聯(lián)邦生態(tài),微眾銀行AI團(tuán)隊也在積極推動聯(lián)邦學(xué)習(xí)國際標(biāo)準(zhǔn)IEEE標(biāo)準(zhǔn)的制定,這一標(biāo)準(zhǔn)有望在兩年內(nèi)出臺,為立法和監(jiān)管提供更多技術(shù)依據(jù)。
聯(lián)邦學(xué)習(xí)將走向何方?人工智能將走向何方?楊強(qiáng)教授的觀點是,數(shù)據(jù)可以不出本地,各個數(shù)據(jù)擁有方可以在安全、保密的前提下交換人工智能模型的參數(shù),以達(dá)到聯(lián)合建模的目的。這種不同學(xué)科的交叉融合是趨勢,聯(lián)邦學(xué)習(xí)和遷移學(xué)習(xí),或者是其他機(jī)器學(xué)習(xí)方法,都可以相互融合,發(fā)揮各自的特點,從一個領(lǐng)域下的人工智能算法理論邁向多個領(lǐng)域,這才是更有價值的研究。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。