文|白 鴿
編|王一粟
今年世界人工智能大會上,大模型如何走向深度應用成為重要議題。
但在大模型邁向深度應用的過程中,相比于算力的稀缺,“真正的問題是缺數據,無論是在通用技術領域,還是在專業(yè)領域,數據才是決定AI能力的上限。”螞蟻集團副總裁兼首席技術安全官、螞蟻密算董事長韋韜表示。
畢竟,想要解決真正的行業(yè)、專業(yè)應用問題,都依賴于關鍵數據能不能按需獲得。但想要獲取高質量數據卻并不是一件容易的事情,尤其是在具體的某個行業(yè)場景中。
就拿金融行業(yè)來說,此前一位智譜AI技術專家對光錐智能表示,金融行業(yè)非常注重數據的隱私性,智譜AI在服務銀行客戶時,數據只能在銀行自己內部使用,不允許拿到外部進行大模型訓練。
背后原因在于,數據價值越高,風險越大,畢竟數據本身復制成本非常低,明文數據很容易造成二次分發(fā),從而引發(fā)數據泄漏問題。
因此,高質量的行業(yè)數據難以流通起來,這也在很大程度上限制了行業(yè)大模型的迭代更新和應用落地。那么,有什么方法能夠在保證行業(yè)數據安全的情況下,能夠讓數據大規(guī)模流通起來?
此背景下,行業(yè)開始探索平衡數據流通與隱私安全的技術路徑。
韋韜認為,密算會成為數據可信流通的新算力,只有讓數據以密態(tài)方式流通,才能發(fā)揮正向價值、控制負向風險,“無論是對AI進一步發(fā)展的支撐,還是對整個數據行業(yè)支撐,我們認為行業(yè)將會從通算、智算走向密算。”
行業(yè)大模型落地,密算為數據流通提供安全通道
“我們一定要做大、做強行業(yè)大模型。”中國電信大模型首席專家、大模型團隊負責人劉敬謙在世界人工智能大會上說,一方面,借助行業(yè)大模型可以拉起我國整個大模型技術的發(fā)展,另一方面,行業(yè)也能夠為大模型的應用提供內生需求場景。
不過,行業(yè)大模型發(fā)展背后的關鍵,則在于行業(yè)數據的供給。
但當前行業(yè)數據的供給方、大模型廠商,以及用戶之間,卻很難建立相互信任的體系。企業(yè)擔心數據對外泄露,大模型廠商擔心模型資產安全,用戶擔心個人數據和隱私泄漏的風險。
這也就導致AI大模型在跨系統(tǒng)、跨行業(yè)的應用中,遇到了數據整合與流通的難題。
現階段,在大模型落地方案中,通過自有數據開展微調、RAG或智能體應用,并提升自有數據檢索和理解能力的大模型還十分初級,距真正賦能行業(yè)的大模型還相距甚遠。
“密態(tài)計算,是大模型產業(yè)深入應用的必經之路。”螞蟻密算CEO王磊說。
為什么密態(tài)計算能夠解決數據流轉過程中的安全問題?
數據密態(tài)流通的本質是通過密碼學,把訪問邊界從傳統(tǒng)的物理邊界變成密鑰管控的虛擬數字空間邊界,即使數據離開了數據的運維域以后,依然能夠進行有效管控。
此前,王磊曾解釋道,密態(tài)計算的本質邏輯,是機構一將數據通過密態(tài)環(huán)境給到機構二,在這個密態(tài)環(huán)境中,機構二能夠使用這部分數據,但并不能夠看到這些數據。也就是業(yè)界經常提的,“數據可用,不可見。” 機構二只能夠按照雙方約定方式使用數據,且其加工后的數據也只能存放到密態(tài)環(huán)境中,只有雙方經嚴格的數據確權后,數據衍生產品才能夠以明文的方式析出。
這不僅可以確保數據在流通過程中不能被窺探和復制,也能夠確保數據在流通過程中的行為可控。也能夠實現對相關信息進行保存并進行溯源,防止抵賴。
這相較于傳統(tǒng)的數據安全技術,已經發(fā)生了根本性的變化,“傳統(tǒng)數據安全技術是保障運維域內的數據安全,而密態(tài)計算技術核心保障的是域外數據的安全,是外循環(huán)的數據安全。”韋韜解釋道。
實際上,密態(tài)計算是把對人的信任轉移到對技術的信任,實現數據跨主體流通過程中跨域管控的問題。通過利用密態(tài)計算技術,實現數據密態(tài)流轉,做到數據“可用不可見,可控可計量”。
現階段,大模型行業(yè)雖然發(fā)展的“熱火朝天”,但在具體應用層面,卻很難從可用走向專業(yè)應用,背后的關鍵,就在于高質量行業(yè)數據的稀缺。而想要高質量的行業(yè)數據大規(guī)?尚帕魍,密態(tài)計算是關鍵。但只有標準化的技術和產品,才能夠加速行業(yè)應用。
密算產品化、云化,加速用起來
任何新技術和產品,都需要經過小規(guī)模試點后,才能邁向大規(guī)模應用階段,密算技術同樣如此。
事實上,此前業(yè)內也有使用密碼技術進行數據安全防護,但單純使用密碼學技術成本太高,導致難以大規(guī)模應用。同時,當前由數據泄漏造成的安全成本增加問題正日益嚴重。
據IBM《2023年數據報告》顯示,2023年數據泄露的全球平均成本上升至445萬美元,達到歷史新高,比2022年的435萬美元增加了2.3%,比2020年的386萬美元增加了15.3%。
因此,如何平衡安全技術的成本和數據價值,讓密態(tài)技術能夠更好的為數據流通做底層安全保障,則成為推動數據大規(guī)模流轉的關鍵。
韋韜表示,螞蟻通過可信芯片和機密計算技術來協同保障,從而大幅度降低成本,實現低成本密態(tài)計算,形成行業(yè)里規(guī);瘧梅桨。
螞蟻集團在WAIC上發(fā)布的“隱語 Cloud” 大模型密算平臺,就是螞蟻密算科技貫徹這一技術路線而發(fā)布的首款商業(yè)化產品。該平臺通過軟硬件結合的可信隱私計算技術,在大模型托管和大模型推理等環(huán)節(jié)實現數據密態(tài)流轉,保護模型資產、數據安全和用戶隱私。
“隱語Cloud”大模型密算平臺首批推出兩大服務,分別為大模型密態(tài)托管和大模型密態(tài)推理。
大模型密態(tài)托管,指模型提供方可以將模型加密后托管在平臺上,一鍵完成云上密態(tài)部署,保護模型資產不被泄漏和盜用;大模型密態(tài)推理,是指數據以密態(tài)形式完成推理,保護用戶交互時的數據安全、商業(yè)機密等。
“整個密態(tài)訪問流程非常輕量化,遠程認證,密鑰交換和加密操作都是在瀏覽器中完成,和明文大模型的訪問體感一致。用戶如果擔心其安全性,也可以自己打開瀏覽器側的代碼,來確認整個訪問過程的安全性。”王磊說。
同時,該平臺支持GPU在可信執(zhí)行環(huán)境下進行計算,使得大模型推理在密態(tài)形式下的響應時間和使用效率與明文大模型接近,實現大規(guī)模商業(yè)可用。
在安全保障上,該產品利用內存、磁盤加密等方法,實現用戶訪問的端到端加密和托管模型的跨域訪問控制。
技術產品化可以讓用戶先用起來,使數據小規(guī)模流動,但想要數據真正大規(guī)模流動,王磊認為:“用‘云’的方式才會實現數據的規(guī);鲃,并把安全技術的成本降下來。”
現階段有很多機構,數據在私域內,又希望用大模型,所以把大模型私有化部署到域內來。但私有化部署會帶來的兩個問題,一個是大模型更新迭代非?,企業(yè)很難快速部署最新升級的大模型產品,導致模型的效果受到影響。更重要的是,私有化部署的成本很高,很難大規(guī)模普及。
王磊認為:“隱私計算是保障用戶數據安全和隱私的重要技術,但是它成本很高,之前只有一些非常有錢的機構才能夠用的起,但通過‘云’的方式是能降成本的。”
今年5月,螞蟻集團對外透露,在今年內發(fā)布 “隱語Cloud”密態(tài)計算的相關產品和服務,讓企業(yè)像購買云服務一樣購買隱私計算服務,支持數據跨云跨端可信流通。此次隱語Cloud大模型密算平臺,也會提供公有云和專有云交付方案,支持市面上主流的通用大模型。
以公有云為例,提供PaaS層服務,模型提供者可以一鍵加密上傳自己的大模型,10分鐘即可完成高可用推理服務的發(fā)布。用戶通過網頁就可以實現對模型的加密訪問,無需感知到復雜的加密過程,即開即得。
“我們希望通過密算技術給用戶非常強的安全保障,解決“不敢、不愿”的問題,再通過密算云服務解決“不會”的問題。”韋韜表示,“同時,還希望推動行業(yè)把整個鏈路走通,讓大家能夠敢而且愿意把高價值的數據流通起來。”
當前,密算技術已準備好,而接下來則是要邁入真正的商業(yè)化落地應用,畢竟技術只有商業(yè)化落地,才能夠可持續(xù)地產生價值。
商業(yè)化的成功,需重塑隱私計算的市場格局
螞蟻密算和傳統(tǒng)隱私計算的最大區(qū)別,在于重新樹立了隱私計算的市場格局。
從技術的角度來講,近年來雖然行業(yè)中一直對隱私計算進行了相關技術研發(fā)和應用,但在韋韜看來,很多隱私計算技術包括現在用的最多的是PSI(隱私計算求交),應用效果非常好,但非常淺,只是其中一個環(huán)節(jié),并沒有實現數據流轉全鏈路保障。
而數據就像自來水,局部流通的價值遠遠小于全域流通。
技術的迭代更新能夠逐步降低應用成本,但想要真正實現大規(guī)模商業(yè)化,本質上還需要數據產業(yè)鏈條上的各方參與者,從原本的安全成本投入思維,轉向利益分潤的模式。
“行業(yè)數據的提供方,是希望能夠通過數據進行變現,變現的最好模式就是基于行業(yè)大模型能夠持續(xù)的提供產品價值,來獲得收入;而模型的提供方,也是希望能夠持續(xù)獲得分潤,而不是一次性的售賣。”王磊表示。
事實上,在原本隱私計算的商業(yè)模式中,主要是通過賣軟件技術,以高成本的項目交付方式進行。但因為安裝環(huán)境,使用方法等各種問題,僅僅提供軟件并沒法保證數據流通過程的安全性,同時這種高成本低利潤的商業(yè)模式,也導致隱私計算技術提供商無法在安全技術上持續(xù)投入。
“但是隱私計算是要讓數據流通起來,并且保證數據安全,這是最終目的。”王磊說道,“我們希望的商業(yè)模式,是對安全結果負責。保證整個數據流通的過程中的安全性,從全鏈路上降低成本和法律風險,并由于數據價值得到了保障,密態(tài)計算技術提供商可以從被保障的數據價值中分得利潤。”
因此,螞蟻密算希望能夠通過多方聯動,在構建全產業(yè)鏈數據安全防護的基礎上,能夠讓各方獲得一定的利益,從而更好的推動安全技術的投入和支出。
現如今,密態(tài)計算已經進入規(guī);虡I(yè)應用的前夜。
“螞蟻密算的使命是通過密算科技推動數據可信流通。”韋韜說道,“科技是最大普惠,但技術通過商業(yè)化是最好的服務社會的形式,這是我們成立浙江螞蟻密算公司的初衷。”
不過,雖然現階段隱私計算已經在部分場景中已經有了商業(yè)化落地應用,但在行業(yè)大模型應用場景中,仍處于PoC階段。
對于密態(tài)計算的商業(yè)化應用,韋韜認為,隱私計算技術非常像光伏,光伏剛推出來的時候價格昂貴,肯定不是讓所有行業(yè)全部用上,但高需求行業(yè)先用起來后,實現規(guī);慕档统杀,當它降到臨界點的時候,對于光伏而言發(fā)電成本跟煤電相當的時候,全面大規(guī)模展開應用。
同理,隱私計算也一定是從比較高價值的數據,高價值的場景開始來用,但是它解決的問題不是只有高價值數據才有的需求。“當密態(tài)計算的成本,降低到數據流通價值的5%,就能夠實現規(guī)模化推廣。”韋韜曾向光錐智能提到。
與此同時,市場化的應用,還需要交給市場化的手段。在密態(tài)計算技術走向市場商業(yè)化的過程中,韋韜認為可以引入保險機制。
保險公司主要有兩個作用,一個是事前,保險公司做獨立的第三方,去看所有產品的安全性是不是能達標,并根據實際安全風險狀態(tài)收取不同費率的保費。第二個,真的出現了黑天鵝事件,事后(保險公司)做風險兜底。
通過這個方式,才能推動整個產業(yè)良性地運作起來。只有商業(yè)的模式健康運轉起來,技術的迭代也才能可持續(xù)地健康發(fā)展。
隨著大模型的大規(guī)模商業(yè)化落地,數據要素的流通市場也勢必會不斷擴大。但現在現階段,隱私計算技術在大模型數據可信流通賽道中,尚屬于早期,未來真正的商業(yè)化落地,仍需要驗證。
但隱私計算就像數據的安全通道,越快打開,大模型的落地效率就會更高。就像螞蟻集團董事長兼CEO井賢棟此前所比喻的,數據價值就像“自來水”一樣,從原來的數據孤島,像自家水井一樣自產自銷,走向“桶裝水”式的點對點流通。
接下來,大規(guī)模數據流轉會發(fā)展為猶如“城市自來水網”的行業(yè)、區(qū)域間可信流通,走向未來更廣域的可信流通,形成綜合水利工程。在此基礎上,大模型產業(yè)及各種數據要素的應用場景,將都能夠充分應用數據要素價值,實現跨行業(yè)、跨地域和跨云可信流轉和互聯互通。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。