上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購(gòu)物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測(cè)試版現(xiàn)已開(kāi)放革命性AI對(duì)話系統(tǒng)Moshi問(wèn)世:機(jī)器也能說(shuō)人話了?阿里國(guó)際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領(lǐng)先的目標(biāo)網(wǎng)絡(luò)AI 3D生成天花板再拉升!清華團(tuán)隊(duì)煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛(ài)“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個(gè)“0元開(kāi)店”類目,推出多項(xiàng)新商入駐權(quán)益年內(nèi)狂攬五項(xiàng)第一,“字節(jié)系大模型”何以后發(fā)先至?
  • 首頁(yè) > 行業(yè)峰會(huì)

    字節(jié)跳動(dòng)Jeddak Team在iDASH 2023隱私計(jì)算大賽上獲得優(yōu)異成績(jī)

    2023年11月24日 18:33:19   來(lái)源:中文科技資訊

      近日,2023 iDASH 國(guó)際隱私計(jì)算競(jìng)賽落下帷幕,字節(jié)跳動(dòng)安全研究-Jeddak可信隱私計(jì)算團(tuán)隊(duì)聯(lián)合南京大學(xué)、南方科技大學(xué)、香港城市大學(xué)組建的 Jeddak Team 聯(lián)合戰(zhàn)隊(duì),獲得機(jī)密計(jì)算賽道第一名、同態(tài)加密賽道第二名的優(yōu)異成績(jī)。值得一提的是,在iDASH 2022大賽上,Jeddak team首次參加大賽,即入圍可信計(jì)算和區(qū)塊鏈賽道前三。

      iDASH是數(shù)據(jù)隱私與安全計(jì)算領(lǐng)域的國(guó)際最高規(guī)格競(jìng)賽,由美國(guó)國(guó)立衛(wèi)生研究院(NIH)主辦,歷年來(lái)吸引了全球頂尖高校和科技公司的積極參與。今年的大賽共吸引了來(lái)自12個(gè)國(guó)家的62支隊(duì)伍參賽,包括哈佛大學(xué)、耶魯大學(xué)、麻省理工學(xué)院、加州大學(xué)圣迭戈分校以及英特爾、騰訊、螞蟻集團(tuán)、阿里巴巴等隊(duì)伍。

      此次比賽設(shè)置了機(jī)密計(jì)算、同態(tài)加密、區(qū)塊鏈共3個(gè)賽道,組委會(huì)根據(jù)各賽題場(chǎng)景篩選出滿足要求的方案設(shè)計(jì)和代碼實(shí)現(xiàn),然后從性能、精度等指標(biāo)維度對(duì)各參賽隊(duì)進(jìn)行排名。作為 Best-Performing Team,Jeddak team團(tuán)隊(duì)成員受邀在耶魯大學(xué)舉行的 iDASH Workshop 2023 上展示了參賽方案。

    圖片1.png

      賽題總覽

      隱私計(jì)算是一種能夠保護(hù)數(shù)據(jù)隱私的計(jì)算解決方案,通過(guò)前沿密碼學(xué)、可信硬件等先進(jìn)技術(shù)手段,為用戶提供安全合規(guī)的數(shù)據(jù)流通交易與融合共享,以此發(fā)揮更大價(jià)值;同時(shí)也滿足了數(shù)據(jù)的“可用不可見(jiàn)”。隱私計(jì)算通常可由“軟/硬”兩類技術(shù)實(shí)現(xiàn):前者本質(zhì)是圍繞數(shù)據(jù)自身做隱私保護(hù),例如此次賽道之一的同態(tài)加密;而后者是對(duì)數(shù)據(jù)所處的計(jì)算環(huán)境做安全防護(hù),例如另一賽道的機(jī)密計(jì)算。一般情況下的常規(guī)計(jì)算都是在數(shù)據(jù)明文基礎(chǔ)上進(jìn)行的,而同態(tài)加密計(jì)算是指:在其對(duì)應(yīng)的密文基礎(chǔ)上執(zhí)行運(yùn)算。兩者分別針對(duì)明、密文數(shù)據(jù)的基本操作,如加法和乘法也都是一一對(duì)應(yīng)的、并且最終計(jì)算結(jié)果相同;區(qū)別只是其中之一被加密,所以只有該數(shù)據(jù)的所有者因掌握了密鑰才能解密獲得結(jié)果。形象地講,兩者是計(jì)算等效的“平行世界”關(guān)系,其中同態(tài)加密額外提供了隱私保護(hù)能力,因?yàn)樵谡麄(gè)過(guò)程中數(shù)據(jù)始終處于密態(tài)。另外一類以硬件機(jī)制為代表的機(jī)密計(jì)算,可簡(jiǎn)單理解為:構(gòu)建了一個(gè)與外界隔離的沙箱環(huán)境,于是敏感數(shù)據(jù)在里面的計(jì)算使用不受干擾,實(shí)現(xiàn)了機(jī)密性和完整性保護(hù)。

      在生物信息領(lǐng)域,一方面對(duì)個(gè)人數(shù)據(jù)的隱私保護(hù)至關(guān)重要,另一方面醫(yī)療單位和研究機(jī)構(gòu)又迫切需要打通各方數(shù)據(jù)。因此,隱私計(jì)算已逐漸成為該領(lǐng)域的關(guān)鍵技術(shù),促進(jìn)多方共同參與、合規(guī)挖掘利用數(shù)據(jù)的寶貴價(jià)值:來(lái)自不同數(shù)據(jù)源的生信數(shù)據(jù)經(jīng)過(guò)加密處理后,存儲(chǔ)在具備隱私計(jì)算能力的云平臺(tái)上,進(jìn)而為泛在數(shù)據(jù)使用提供所需服務(wù)。例如,隱私計(jì)算能夠幫助醫(yī)療、保險(xiǎn)機(jī)構(gòu)利用個(gè)體基因數(shù)據(jù)有效地預(yù)測(cè)潛在疾病風(fēng)險(xiǎn),從而作出綜合評(píng)判。研究人員也可以通過(guò)隱私計(jì)算挖掘數(shù)據(jù)多維度價(jià)值,建立精準(zhǔn)模型輔助診療、加速新藥物研發(fā)等,推動(dòng)生物信息領(lǐng)域的研究和應(yīng)用創(chuàng)新。

      在本屆iDASH競(jìng)賽中,機(jī)密計(jì)算賽道要求在確保全過(guò)程基因數(shù)據(jù)的安全隱私前提下,實(shí)現(xiàn)高效的基因組推斷。Jeddak團(tuán)隊(duì)提出了基于可信執(zhí)行環(huán)境(TEE)的解決方案,該方案可以有效應(yīng)對(duì)各類高負(fù)載的計(jì)算任務(wù)(如數(shù)據(jù)清洗、結(jié)構(gòu)預(yù)測(cè)、差異表達(dá)分析、突變檢測(cè)等),不但能夠準(zhǔn)確完成、同時(shí)也提供了能效更高的安全隱私保障。

      同態(tài)加密賽道要求根據(jù)基因數(shù)據(jù)的密文、來(lái)識(shí)別基因樣本和基因數(shù)據(jù)庫(kù)之間的親屬關(guān)系。Jeddak團(tuán)隊(duì)通過(guò)分析基因數(shù)據(jù)的特征,提出了親屬關(guān)系判別算法,以及相應(yīng)的基因數(shù)據(jù)編碼方式和高性能密文計(jì)算方案。不僅能夠高效處理基因組數(shù)據(jù),還適用于各種高維度的隱私數(shù)據(jù)密態(tài)分析。

    圖片2.png

      機(jī)密計(jì)算賽道揭秘

      機(jī)密計(jì)算賽題是加固并優(yōu)化現(xiàn)有的基因組推斷算法PanGenie,以提高其在處理人類基因數(shù)據(jù)過(guò)程中的計(jì)算性能與數(shù)據(jù)安全。目前,變異感知的泛基因組圖(Variation-aware Pangenome Graph)已成為一種更為有效的人類參考基因組表示形式,而短序列片段測(cè)序(Short-reads Sequencing)由于其高效性和低成本仍然是最實(shí)用的測(cè)序方式。PanGenie則是基于這兩類信息設(shè)計(jì)的一類高效基因組推斷算法。今年的iDASH競(jìng)賽首次引入了基于AMD SEV技術(shù)的可信執(zhí)行環(huán)境,以確保在數(shù)據(jù)處理過(guò)程中的安全隱私性。此外,比賽還對(duì)資源使用進(jìn)行了嚴(yán)格限制,規(guī)定參賽隊(duì)伍最多使用2臺(tái)虛擬機(jī),每臺(tái)虛擬機(jī)只能使用4個(gè)計(jì)算核心,并要求可信計(jì)算基(TCB)不超過(guò)1MB。本次比賽主要考察機(jī)密計(jì)算系統(tǒng)的設(shè)計(jì)與優(yōu)化水平。

      針對(duì)本次賽題的考核要求,Jeddak Team對(duì)指定算法PanGenie與其實(shí)現(xiàn)進(jìn)行了細(xì)致全面的分析,從并行化、內(nèi)存優(yōu)化、執(zhí)行流程優(yōu)化、編譯期優(yōu)化等多個(gè)角度對(duì)原有實(shí)現(xiàn)進(jìn)行了重構(gòu)創(chuàng)新,在保證方案的安全性前提下,高效發(fā)揮利用給定的計(jì)算資源、突破能效瓶頸。下面介紹Jeddak Team方案的主要優(yōu)化點(diǎn):

      首先參考下圖,Jeddak Team基于賽題中最多使用2臺(tái)虛擬機(jī)的條件,將整個(gè)基因組推斷的工作負(fù)載拆分到了2個(gè)虛擬機(jī)中并行執(zhí)行。而在每個(gè)工作節(jié)點(diǎn)(Worker)中,工作流被分為了兩個(gè)階段:預(yù)處理階段PanGenie工作負(fù)載階段。

    圖片3.png

      預(yù)處理階段

      1. 在本階段,2個(gè)工作節(jié)點(diǎn)首先會(huì)對(duì)預(yù)先放置于其磁盤內(nèi)的數(shù)據(jù)文件進(jìn)行數(shù)據(jù)提取,該過(guò)程中節(jié)點(diǎn)會(huì)提取出數(shù)據(jù)中的關(guān)鍵信息,用作后續(xù)的參數(shù)選擇。

      2. 在前期調(diào)研中Jeddak Team發(fā)現(xiàn):一個(gè)關(guān)鍵的哈希表的大小會(huì)對(duì)整體的性能造成極大的影響,而適當(dāng)?shù)剡x擇較大的規(guī)模會(huì)比選擇小哈希表所造成的開(kāi)銷少很多。為此Jeddak Team采用了自適應(yīng)的哈希表規(guī)模選取策略,會(huì)根據(jù)實(shí)際的數(shù)據(jù)規(guī)模自適應(yīng)地選擇參數(shù)。

      3. 在實(shí)際情況下,一份樣本包含了多個(gè)染色體,而不同染色體對(duì)應(yīng)的基因數(shù)據(jù)的分布并不均衡,所以簡(jiǎn)單粗暴地按照編號(hào)來(lái)進(jìn)行分配會(huì)導(dǎo)致工作節(jié)點(diǎn)負(fù)載的不平均,為此Jeddak Team采用了貪心算法以實(shí)現(xiàn)節(jié)點(diǎn)間的負(fù)載均衡。

    圖片4.png

      PanGenie工作負(fù)載階段

      在這個(gè)階段工作節(jié)點(diǎn)會(huì)根據(jù)分配到的染色體編號(hào)來(lái)并行化數(shù)據(jù)處理,因?yàn)槊總(gè)染色體對(duì)應(yīng)的計(jì)算邏輯是獨(dú)立的。于是能夠最大發(fā)揮工作節(jié)點(diǎn)的計(jì)算能力。

      由于任務(wù)是分配到2個(gè)節(jié)點(diǎn)上執(zhí)行,該過(guò)程中需要對(duì)統(tǒng)計(jì)信息(Read Variant、Load KMer Statistics)、計(jì)算結(jié)果(Genotyping)進(jìn)行同步,Jeddak Team對(duì)所有的通信數(shù)據(jù)進(jìn)行加密以保證數(shù)據(jù)安全。

    圖片5.png

      針對(duì)PanGenie的工作負(fù)載階段,Jeddak Team也采用了多個(gè)優(yōu)化方案來(lái)一并提高整體的算法執(zhí)行效率:

      ● PanGenie算法中使用了隱馬爾可夫模型(Hidden Markov Model,HMM)來(lái)進(jìn)行基因型的推斷,Jeddak Team針對(duì)算法中HMM的發(fā)射概率以及轉(zhuǎn)移概率進(jìn)行了優(yōu)化。具體來(lái)說(shuō),Jeddak Team通過(guò)預(yù)處理部分概率值,降低每次實(shí)時(shí)計(jì)算的開(kāi)銷,從而減少了整個(gè)HMM在計(jì)算過(guò)程中的復(fù)雜度。

      ● 充分發(fā)揮AMD CPU提供的AVX指令集來(lái)提高對(duì)浮點(diǎn)型數(shù)據(jù)處理的效率。相較于分別計(jì)算多個(gè)浮點(diǎn)數(shù),Jeddak Team通過(guò)單指令流多數(shù)據(jù)流(Single Instruction Multiple Data,SIMD)技術(shù),實(shí)現(xiàn)了對(duì)四個(gè)浮點(diǎn)數(shù)的同時(shí)運(yùn)算,從而成倍提高了計(jì)算效率。

    圖片6.png

      根據(jù)主辦方設(shè)置的兩個(gè)測(cè)試樣例,Jeddak Team的方案在僅使用2臺(tái)安全虛擬機(jī)、共計(jì)8個(gè)可用線程的嚴(yán)格限制下,最多耗費(fèi)2.6小時(shí)就運(yùn)行完成了測(cè)試,成為機(jī)密計(jì)算領(lǐng)域13個(gè)參賽隊(duì)伍中唯一完賽的團(tuán)隊(duì);同時(shí)Jeddak Team的方案保證了準(zhǔn)確率在99%以上,且可執(zhí)行代碼(TCB)也僅有920KB大小。

    圖片7.png

      整個(gè)方案是Jeddak Team聯(lián)合香港城市大學(xué)、南方科技大學(xué)共同設(shè)計(jì)與實(shí)現(xiàn)。最終在本屆iDash大賽上取得了第一名的優(yōu)異成績(jī)。

      同態(tài)加密賽道揭秘

      同態(tài)加密賽題設(shè)定的場(chǎng)景是:法醫(yī)鑒定時(shí),檢查機(jī)構(gòu)使用嫌犯基因、向數(shù)據(jù)機(jī)構(gòu)的基因數(shù)據(jù)庫(kù)去查詢是否存在嫌疑人的親屬,從而快速定位嫌疑人身份。賽題要求檢查機(jī)構(gòu)和數(shù)據(jù)機(jī)構(gòu)的基因數(shù)據(jù)都需要使用同態(tài)加密技術(shù)保護(hù),數(shù)據(jù)經(jīng)過(guò)加密后會(huì)交由一個(gè)第三方計(jì)算機(jī)構(gòu)進(jìn)行密文預(yù)測(cè),最后得到的密文結(jié)果可以被檢查機(jī)構(gòu)解密作為判斷親屬關(guān)系的依據(jù)。

    圖片8.png

      比賽要求判別400條查詢樣本在一個(gè)擁有2000條基因數(shù)據(jù)的數(shù)據(jù)庫(kù)中是否存在親屬。其中正負(fù)查詢樣本的數(shù)量相同。在整個(gè)計(jì)算流程中,檢查機(jī)構(gòu)與數(shù)據(jù)機(jī)構(gòu)的基因數(shù)據(jù)不能被泄露,計(jì)算機(jī)構(gòu)必須在密文狀態(tài)下處理基因數(shù)據(jù),并且檢查機(jī)構(gòu)與數(shù)據(jù)機(jī)構(gòu)在數(shù)據(jù)加密前不能進(jìn)行相關(guān)預(yù)處理,即提高了系統(tǒng)能效要求。為此,Jeddak Team基于全同態(tài)技術(shù)提出了兩種安全高效的密文關(guān)系預(yù)測(cè)方案。

      在第一個(gè)方案中,Jeddak Team分析了基因數(shù)據(jù)的特點(diǎn):發(fā)現(xiàn)當(dāng)一條待查詢的基因數(shù)據(jù)在數(shù)據(jù)庫(kù)中存在親屬時(shí),它更有可能與數(shù)據(jù)庫(kù)樣本維度的中心點(diǎn)有較大的距離。進(jìn)一步講,如果將基因數(shù)據(jù)與數(shù)據(jù)庫(kù)中心、待查詢數(shù)據(jù)集中心的距離相減,這種距離差異可以更清晰地劃分有、無(wú)親屬關(guān)系的查詢樣本。

    圖片9.png

      基于以上數(shù)據(jù)集特點(diǎn),Jeddak Team設(shè)計(jì)了使用同態(tài)加密方案來(lái)計(jì)算樣本距離數(shù)據(jù)庫(kù)、查詢數(shù)據(jù)集中心的距離差異。首先,Jeddak Team將距離差異的計(jì)算方法優(yōu)化成若干加減法和一次內(nèi)積運(yùn)算組成的算法。在加密數(shù)據(jù)時(shí),Jeddak Team采用CKKS加密算法并通過(guò)系數(shù)編碼的方式將多個(gè)基因數(shù)據(jù)加密到一條密文多項(xiàng)式的系數(shù)上;谶@種編碼方式,可以通過(guò)一次多項(xiàng)式乘法計(jì)算出兩組密文數(shù)據(jù)向量的內(nèi)積,從而得到一條樣本對(duì)應(yīng)的預(yù)測(cè)得分。最后,查詢機(jī)構(gòu)可以解密、并根據(jù)得分大小判斷出查詢樣本是否在數(shù)據(jù)庫(kù)內(nèi)存在親屬的可能性。

    圖片10.png

      第二個(gè)方案則是從直觀認(rèn)識(shí)出發(fā):如果兩條基因數(shù)據(jù)存在親屬關(guān)系,那它們應(yīng)當(dāng)有更小的距離。基于此,Jeddak Team首先通過(guò)條件概率的方法,計(jì)算得到每個(gè)等位基因?qū)ε袛鄻颖居H屬關(guān)系的權(quán)重。實(shí)操中選取1000個(gè)權(quán)重值最大的基因作為判別親屬關(guān)系的依據(jù)。該方案使用了被選取的基因來(lái)計(jì)算每個(gè)查詢樣本與數(shù)據(jù)庫(kù)中心點(diǎn)的距離,從而作為每個(gè)樣本的預(yù)測(cè)結(jié)果。

    圖片11.png

      Jeddak Team依然采用CKKS算法實(shí)現(xiàn)了第二個(gè)方案,并利用復(fù)數(shù)的特點(diǎn)將每?jī)蓚(gè)相鄰的查詢數(shù)據(jù)加密分別加密到同一條密文的實(shí)部和虛部。在密文計(jì)算的過(guò)程中,Jeddak Team首先將被選取基因的明文掩碼作用在每一條加密數(shù)據(jù)上,然后將計(jì)算后的數(shù)據(jù)庫(kù)中心點(diǎn)和每條查詢數(shù)據(jù)均提取到密文的實(shí)部上。最終,查詢樣本與數(shù)據(jù)庫(kù)中心點(diǎn)的距離可以通過(guò)密文乘法和移位操作完成。

      上述兩個(gè)方案是Jeddak Team與南京大學(xué)共同設(shè)計(jì)與實(shí)現(xiàn),最終在iDASH 2023競(jìng)賽中以0.977的得分獲得了第二名的成績(jī)。

    圖片12.png

      Jeddak可信隱私計(jì)算平臺(tái)

      iDASH競(jìng)賽通常設(shè)定的是醫(yī)學(xué)場(chǎng)景,因?yàn)獒t(yī)療數(shù)據(jù)極其敏感,故要求使用隱私計(jì)算技術(shù)在密態(tài)數(shù)據(jù)基礎(chǔ)上執(zhí)行運(yùn)算,從而既實(shí)現(xiàn)業(yè)務(wù)目標(biāo)、又保障數(shù)據(jù)的安全隱私。此次Jeddak Team所使用的核心技術(shù)均源于自研的Jeddak可信隱私計(jì)算平臺(tái),涵蓋機(jī)密計(jì)算、聯(lián)邦學(xué)習(xí)、多方安全計(jì)算、同態(tài)加密、差分隱私、區(qū)塊鏈等多種形態(tài)的產(chǎn)品技術(shù)。據(jù)悉,Jeddak可信隱私計(jì)算平臺(tái)近兩年在字節(jié)內(nèi)外實(shí)施了70余個(gè)隱私計(jì)算相關(guān)項(xiàng)目,典型如ToB側(cè)火山引擎和公司內(nèi)部的抖音用數(shù)管控等。

      隱私計(jì)算在數(shù)據(jù)要素價(jià)值釋放過(guò)程中發(fā)揮著越來(lái)越重要的作用,但因處于早期發(fā)展階段,無(wú)論相關(guān)技術(shù)、產(chǎn)品和市場(chǎng)都亟待深入探索。字節(jié)跳動(dòng)安全研究團(tuán)隊(duì)基于Jeddak的大量應(yīng)用實(shí)踐,總結(jié)出隱私計(jì)算基礎(chǔ)建設(shè)的三個(gè)關(guān)鍵問(wèn)題:技術(shù)突破、產(chǎn)品創(chuàng)新、領(lǐng)域洞察,以下簡(jiǎn)要介紹Jeddak Team的相關(guān)工作。

      ● 技術(shù)突破:核心是解決隱私計(jì)算的能效問(wèn)題。例如此次iDASH競(jìng)賽,不但要求分析建模精準(zhǔn)安全、而且對(duì)計(jì)算能效也提出很高要求。尤其是后者,被認(rèn)為是隱私計(jì)算大規(guī)模應(yīng)用和產(chǎn)業(yè)化的主要瓶頸。為此Jeddak Team從相關(guān)理論創(chuàng)新到工程優(yōu)化的多個(gè)層面做了大量努力,包括自主研發(fā)更高效的安全協(xié)議、硬件加速、以及特有的隱私計(jì)算網(wǎng)絡(luò)等,已全面接入內(nèi)外部業(yè)務(wù);谟邢拶Y源使用、端到端全鏈路執(zhí)行效果如:百億級(jí)數(shù)據(jù)的PSI隱私求交50分鐘完成;億級(jí)千維數(shù)據(jù)的XGB聯(lián)邦學(xué)習(xí)訓(xùn)練約4小時(shí)完成、十億級(jí)推理40分鐘內(nèi)完成;面向百億級(jí)數(shù)據(jù)的PIR匿蹤查詢約4小時(shí)完成;億級(jí)數(shù)據(jù)的MPC多方安全計(jì)算聚合查詢約1小時(shí)完成。這些真實(shí)業(yè)務(wù)場(chǎng)景下的能效突破,不但體現(xiàn)了Jeddak的技術(shù)先進(jìn)性、也奠定其成為工業(yè)級(jí)產(chǎn)品的基礎(chǔ)。

      ● 產(chǎn)品創(chuàng)新:現(xiàn)階段隱私計(jì)算產(chǎn)品的表現(xiàn)形式相對(duì)單一,主要面向解決數(shù)據(jù)流通共享中的一些特定隱私保護(hù)問(wèn)題,缺乏廣泛賦能的平臺(tái)級(jí)和殺手級(jí)應(yīng)用。原因除了上述能效問(wèn)題外,也缺乏集中呈現(xiàn)的豐富場(chǎng)景、以驅(qū)動(dòng)更多嘗試探索。Jeddak Team充分結(jié)合公司內(nèi)外部大量實(shí)際需求不斷實(shí)踐,逐步形成了隱私計(jì)算產(chǎn)品的三類應(yīng)用范式:(1)與數(shù)據(jù)基礎(chǔ)設(shè)施融合。即隱私計(jì)算能力下沉、完整接管上游業(yè)務(wù)的用數(shù)過(guò)程。例如,針對(duì)抖音業(yè)務(wù)中臺(tái)的用數(shù)申請(qǐng)以滿足多源數(shù)據(jù)共享的聯(lián)合建模需求,Jeddak不但為此實(shí)現(xiàn)了數(shù)據(jù)的安全隱私保護(hù)及其所有權(quán)和使用權(quán)分離,同時(shí)也示范了隱私計(jì)算與大規(guī);A(chǔ)設(shè)施的深度融合實(shí)踐。(2)與數(shù)據(jù)產(chǎn)品融合。目的是把隱私計(jì)算功能集成進(jìn)數(shù)據(jù)套件以方便用戶觸達(dá),例如以插件的形式結(jié)合。于是當(dāng)使用套件服務(wù)來(lái)處理敏感數(shù)據(jù)時(shí),便可直接開(kāi)啟保序加密、同態(tài)加密等功能,完成相關(guān)密文計(jì)算,類似把ChatGPT能力與Office套件的各種應(yīng)用關(guān)聯(lián)打通。另一類創(chuàng)新是,Jeddak數(shù)據(jù)安全沙箱與一方敏感數(shù)據(jù)組合并集成進(jìn)便攜式服務(wù)器,形成數(shù)信一體機(jī)產(chǎn)品,從而滿足用戶數(shù)據(jù)不出域條件下、在TEE內(nèi)實(shí)現(xiàn)了多源數(shù)據(jù)的安全匯聚計(jì)算。(3)與數(shù)據(jù)應(yīng)用開(kāi)發(fā)工具融合。目標(biāo)是輔助用戶便捷拓展領(lǐng)域應(yīng)用,例如Jeddak聯(lián)邦學(xué)習(xí)已嵌入公司AI推薦平臺(tái)、并配套研發(fā)了支持調(diào)用的SDK工具。使得平臺(tái)上游業(yè)務(wù)可同時(shí)獲取到聯(lián)邦學(xué)習(xí)能力、輕易構(gòu)建出自己的AI隱私計(jì)算應(yīng)用,從而打通利用更多敏感數(shù)據(jù)源、大幅提升建模質(zhì)量,其作用類似于大模型的領(lǐng)域開(kāi)發(fā)工具鏈LangChain。從實(shí)踐效果看,這三種應(yīng)用范式基本覆蓋和滿足了公司內(nèi)外業(yè)務(wù)的相關(guān)需求,摸索出隱私計(jì)算廣泛賦能的實(shí)施方法和路徑。

      ● 領(lǐng)域洞察:除了技術(shù)突破和產(chǎn)品創(chuàng)新外,還需深入結(jié)合業(yè)務(wù)的屬性特征才能發(fā)揮隱私計(jì)算的最大效用。原因在于,利用這些特定約束可助力實(shí)現(xiàn)成本控制與目標(biāo)達(dá)成的最佳平衡。例如,基于可信計(jì)算的Jeddak數(shù)據(jù)安全沙箱大量服務(wù)了公司職能線(e.g.人力/財(cái)務(wù)/研效等),其業(yè)務(wù)場(chǎng)景特征是:數(shù)據(jù)流轉(zhuǎn)共享常見(jiàn)、處理邏輯靈活多變、且有準(zhǔn)實(shí)時(shí)計(jì)算要求。對(duì)此Jeddak充分結(jié)合利用了TEE技術(shù)特長(zhǎng)和業(yè)務(wù)特點(diǎn),體現(xiàn)出較高實(shí)施效用。另一類典型案例如,一些金融行業(yè)的應(yīng)用對(duì)安全隱私提出極高要求,為此Jeddak Team基于多方安全計(jì)算MPC技術(shù)、設(shè)計(jì)實(shí)現(xiàn)了全密態(tài)機(jī)器學(xué)習(xí)系統(tǒng)以滿足數(shù)學(xué)可證安全性,并且在營(yíng)銷預(yù)測(cè)建模場(chǎng)景中實(shí)際落地。因此,對(duì)業(yè)務(wù)領(lǐng)域的深入洞察不但能幫助提升應(yīng)用效果、甚至可挖掘和推動(dòng)更多的技術(shù)服務(wù)創(chuàng)新。

      對(duì)于隱私計(jì)算的應(yīng)用發(fā)展還有兩類問(wèn)題特別值得關(guān)注。一是對(duì)私域數(shù)據(jù)的保護(hù)和價(jià)值重視:很多實(shí)體往往并不清晰自身數(shù)據(jù)的潛在效用,平時(shí)可能疏于積累和防護(hù),而最近GPT4 Turbo展現(xiàn)的基于私域數(shù)據(jù)的微調(diào)、能夠?yàn)橛脩魟?chuàng)建出高質(zhì)量領(lǐng)域大模型,凸顯其重要性。二是從頂層設(shè)計(jì)的高度來(lái)推動(dòng)隱私計(jì)算的大規(guī)模應(yīng)用、賦能數(shù)字經(jīng)濟(jì):除了產(chǎn)業(yè)政策促進(jìn)外,AI大模型的普及很可能是重要的需求牽引。為此Jeddak Team正積極探索相關(guān)技術(shù),包括基于軟件實(shí)現(xiàn)的大模型聯(lián)邦精調(diào)、以及構(gòu)建由GPU所組成的可信計(jì)算環(huán)境。

      Jeddak Team相關(guān)負(fù)責(zé)人表示:“本次iDASH競(jìng)賽檢驗(yàn)了自身能力水平,同時(shí)也學(xué)習(xí)到很多先進(jìn)經(jīng)驗(yàn),期待未來(lái)與業(yè)界伙伴密切交流合作,共同推進(jìn)隱私計(jì)算的技術(shù)進(jìn)步與蓬勃發(fā)展。”(作者:郝遠(yuǎn)豐)

      行業(yè)峰會(huì)、企業(yè)新品動(dòng)態(tài)更新、媒體邀約請(qǐng)發(fā)郵件至news#citnews.com.cn(把#換成@)。

    [No. X048]
    分享到微信

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。