- +1
對話螞蟻集團副總裁韋韜:如何讓數據流通從主體信任走向技術信任
·企業以前可能會因為對方是信譽的主體而進行數據交易,但這種規模難以擴展,信任被破壞的風險也非常高。但未來,企業會趨向于因為對方使用了安全可信的技術而進行數據交易。
·天空計算作為伯克利大學RISE Lab提出的一種新的云計算架構,其目標是實現云之間的互操作性,讓用戶可以跨越不同的云廠商和服務,按需獲取最優的計算資源和服務,是一個解決云計算異構互聯相當好的思路。因此,數據對“密態”有要求,對“天空”也有要求,就誕生了密態天空計算。
我們所處的時代已經離不開數據,數據喂養誕生了大語言模型,也帶來信息爆炸下的安全合規等問題。隨著數字化轉型的不斷推進,作為生產要素的數據的重要性在各行各業不斷顯現。數據的交易與流轉成了有效利用數據的重點,但目前仍存在諸多問題,如數據泄露、數據濫用等。
2022年12月發布的《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》(“數據二十條”),為數據要素市場化帶來了規范和指引。數據如何流通?怎么保障安全?仍是行業有待探索解決的問題。
2023世界人工智能大會“數據要素與隱私計算高峰論壇”期間,螞蟻集團副總裁兼首席技術安全官韋韜對澎湃科技(www.6773257.com)表示,數據流轉目前的諸多問題,很大一部分原因是技術造成的。目前,很多數據主體之間的交易流轉源于主體信任,即基于互相之間的信任而產生,但“未來數據要交易、流通,需要轉向基于技術信任的流轉模式,數據密態是實現這種技術信任的必經之路。”
韋韜進一步指出,以前數據的流轉、交易是以明文形式為主體來做的,拷貝成本非常低,容易造成二次分發級聯失控。而加密后的數據,安全性能夠產生實質性提升。可信隱私計算是實現數據密態的最有前景的技術之一,可以在數據持有權不失控的前提下,有效實現數據使用權的跨域管控,保障數據要素合法合規流轉并有效產生產業價值。
目前的隱私計算行業還處于較早期的階段,韋韜表示,“密態天空計算”或許是該行業發展的未來。
“密態天空計算”是指基于技術信任的數據跨云互聯,提供數據的跨云密態流轉和計算服務,其目標是允許基于數據密態的應用能跨多個云廠商運行。天空計算(Sky Computing)作為伯克利大學RISE Lab提出的一種新的云計算架構,其目標是實現云之間的互操作性,讓用戶可以跨越不同的云廠商和服務,按需獲取最優的計算資源和服務。 “密態天空計算”是對跨云的“天空計算”更進一步的發展。
“數據需要安全性、隱私化,所以對密態計算有要求。”韋韜指出,“數據在交易流轉的時候,不能限定在一家、兩家,而是在全行業流通。這就需要異構互聯來解決。”
“未來的數據一定是以密態方式流轉”
澎湃科技:目前的數據市場為什么數據流通性較差?
韋韜:此前,數據的流轉、數據的交易是以明文形式為主體來做的,而明文數據的持有和使用其實是失控的,在流轉和交易時,容易導致二次分發和失控,一旦失控,就會導致數據“你有我有大家有”的狀況,數據就失去了交易價值。因此第一代基于明文的數據交易模式沒有取得成功。
數據要素未來的安全合規流轉,首先面臨的是確權的挑戰。“數據二十條”在確權問題方面非常關鍵,幫助行業往前邁了一大步。擱置所有權爭議,采用持有權、使用權和經營權三權分置的方式,非常有效地促進了數據要素的流通。
大家去年談得最多的除了確權問題還有定價問題。在我看來,無論是協商定價,還是分潤,數據一定要流通起來,這是前提。數據只要安全合規流通起來,數據要素就會幫著相關行業產生明顯的價值收益,定價也會是水到渠成的事情。
澎湃科技:未來數據流通會如何發展?
韋韜:未來的數據流轉正在從基于主體信任的模式轉變為基于技術信任的模式。企業以前可能會因為對方是信譽的主體而進行數據交易,但這種規模難以擴展,信任被破壞的風險也非常高。但未來,企業會趨向于因為對方使用了安全可信的技術而進行數據交易,基于技術的信任體系才能支撐全行業數據要素廣泛安全可控地流轉。
未來的數據一定是以密態方式流轉。螞蟻集團在2021年12月正式提出了數據密態概念。密態方式流轉的優勢在于保障了數據資產的持有權,即明文數據或其等價物的持有權不會失控。而針對使用權,我們認為使用權需要跨域管控,就是指當數據要素作為一種要素,在主體之間流通時,即使它不在持有者的運維域內,持有者仍然能夠對其使用進行有效管控。
這是一個全新的核心模式,既能保障數據資產的持有權不失控,又能實現使用權的跨域管控。在這種情況下,數據要素的經營才能得到保障,相關的提供方、加工處理方、運維方也能各自獲得收益。
澎湃科技:數據流通發展中會遇到什么難題?
韋韜:首先第一個是安全合規問題,第二個是會用易用問題。
要保障數據流動的安全合規,第一要推動行業的安全合規,保障數據不濫用、不泄露。這方面行業有明確的指引,比如隱私計算會解決數據的可用不可見、可算不可識、可控可計量的問題。要推動行業建立通用安全分級。不同的技術體系應該建立統一的安全標準,不同的技術路線投入成本和安全性能有很大差異。如果沒有一個指導性的規則,可能會導致行業傾向于選擇性能好但安全性差的技術路線,給整個行業帶來風險。
數據要素流動合規挑戰的一個核心問題是匿名化。匿名化是涉及到個人信息相關的數據要素流動的一個前提。在開放空間中的高維關聯環境下,絕對匿名化只能以個體顆粒度數據價值的絕對毀損為前提。所以如何在一個可信的安全受控環境中實現相對匿名化,是數據要素行業發展需要探索和實踐的重要方向。
其次是會用易用問題。在技術角度,數據加密本身并不新鮮。伴隨20多年的互聯網發展,數據加密已經在金融支付、電子商務等場景下廣泛應用。但這些數據加密大多停留在存儲和傳輸階段。一旦涉及“計算”,數據往往需要回到安全性弱、容易失控的明文狀態。而“數據密態”的核心任務,就是要把加密延展到計算環節,意味著即使在運算期間,也不會出現明文數據。今天行業里廣泛應用的隱私計算技術就是這樣一種“數據密態”技術。
但今天隱私計算技術的會用易用問題對于中小企業來說,有非常高的門檻。中小企業缺乏隱私計算和數據密態相關人才,所以現在大部分都是交給隱私計算創業公司,這是很好的創業領域。但對于全行業來說,如果整個行業的發展都依賴于相對有限的專業人才的重人力投入的話,那么發展無疑會遇到嚴重的瓶頸。所以未來我們認為一定要賦能整個相關的數據ISV(Independent Software Vendors,獨立軟件開發商),讓他們支撐住中小企業所需的隱私計算和數據要素密態領域的應用能力。而這個的關鍵是“密態計算即服務”(C2aaS,Cryptographic Computing as a Service),只有通過服務的方式提供密態計算能力,才能有效降低ISV和中小企業快速應用的技術門檻。
“如何在不公開數據的情況下使用數據?”
澎湃科技:數據密態是一個相當“硬核”的概念,如何通俗地解釋?
韋韜:先說定義,在數據進入流轉進行共享、計算直到銷毀的完整傳播鏈路中,保持數據處于加密狀態不出現明文,將數據持有權與使用權分離,實現數據使用權的跨域管控,以確保數據流轉的全程安全可控。
我先舉一個例子來簡單地解釋隱私計算的概念,隱私計算是指在保護數據本身不對外泄露的前提下實現數據分析計算的一類信息技術。現在假設有ABC這3個人,在不能透露具體工資數額情況下,如何給3個人的工資求和呢?
其實非常簡單,A把自己的工資數額拆成3個隨機數之和,第一個自己留著,第二個隨機數給B,第三個隨機數給C;B也把自己的工資拆成3個隨機數之和,以此類推……最后3個人手上都各自有3個隨機數,先各自對自己手上的3個隨機數求和,然后3人再共同把這3個“和值”再求和就是3個人工資總和。在這個過程中,所有人的工資數都轉化為了隨機密態因子流通,沒有任何人的具體工資泄露。
完整的可信隱私計算的要求則更高。這個過程中,我們如何保證ABC這3個人中兩個人不互相串通?獲取其他隨機數的過程中,如何保證沒有暗箱操作?由誰來公證?這些就是可信隱私計算要解決的問題。
在技術上看,數據密態其實是密碼學界一直希望達到的境界。在行業上看,數據密態也契合了未來數據持有權和使用權分離的發展趨勢。
澎湃科技:螞蟻提及密態天空計算是數據密態的未來,如何理解這一概念?
韋韜:密態天空計算是在數據密態的基礎上更上一層樓。上述提到的工資求和問題中,數據密態解決了安全性問題,但只適用于小范圍的,兩方、三方的數據,那么ABC這3個人算工資的方法是否適用于其他數據的計算方式?當DEFG等更多人帶著不同的計算方式參與進來該怎么辦?成本、性價比問題如何解決?
上述提到的小型企業,通過專門的隱私計算公司在云端提供收費較低的C2aaS(cryptographic computing as a service,密態即服務)是一個解決方案。而不同公司提供的云服務之間又存在壁壘,這就涉及到了異構互聯的問題,多方數據交易使用不同的加密方法,需要在保證安全性的前提下打通各方壁壘。天空計算(Sky Computing)作為伯克利大學RISE Lab提出的一種新的云計算架構,其目標是實現云之間的互操作性,讓用戶可以跨越不同的云廠商和服務,按需獲取最優的計算資源和服務,是一個解決云計算異構互聯相當好的思路。
因此,數據對“密態”有要求,對“天空”也有要求,就誕生了密態天空計算。
澎湃科技:目前數據要素市場的發展如何?數據密態技術發展如何?
韋韜:我們認為數據要素市場的發展可以分為3個階段,也就是我們去年提出的密態三步項目:
第一階段是計算密態化,即所做的計算都是基于明文數據集,通過密態計算得到密態結果,相當于直接從數據源到結果,這就是計算密態化。在這個過程中,主要是讓行業感受到建立隱私計算的概念,確信數據“可用不可見,可控可計量”的安全是可以保證的。
第二階段是大數據密態化,這是我們今天基本上處于的階段,也是要真正把隱私計算深度應用起來,能夠解決更復雜問題的階段。它跟第一階段有本質區別。大數據里面涉及到的數據處理、機器學習等都需要大量的中間結果。第二階段中,這些中間結果也需要是純密文的。所以這就對算法提出了更高的要求。這個階段對于行業的主要挑戰是要降低技術門檻,解決會用易用的問題。
第三階段,即真正將這一技術投入使用的階段。當我們真正會用以后,行業推廣會面臨使用成本問題,我們要根據情況來判斷。在數據密態化方面,把成本降下來就一定要把規模擴大,尤其是把基礎設施規模擴大,實現廣泛普惠的互聯互通。
澎湃科技:目前在隱私計算方面有何應用?
韋韜:隱私計算在金融風控、互聯網營銷場景有很多應用,對其他場景、比如醫療、能源、供應鏈等場景也有不少應用需求。
螞蟻集團曾在去年7月宣布面向全球開發者正式開源可信隱私計算框架“隱語”,隱語第一次在業內提供多種不同隱私計算的技術路線,包括聯邦學習、多方安全計算、可信執行環境等。這樣能夠較好地符合各種部署環境下不同的網絡適配要求、不同安全的等級要求,支撐各種場景應用。
比如,螞蟻基于自研“隱語技術棧”開發了金融級應用產品螞蟻“風洞多方安全計算平臺”。這項產品具備安全、高效、行業定制三大特點,可滿足金融級全鏈路風控、大規模生產環境、精準決策等金融場景的三大高要求,同時可自主接入易用。借助這項產品,江蘇某銀行在信用風險管理方面已識別出超過11萬名高風險客戶,阻止了數十億人民幣的高風險貸款的發放。
此外,螞蟻鏈為杭州國際數字交易中心提供底層技術支持,助力“杭數交”打造“3+1+N”數字交易平臺。通過區塊鏈和隱私計算技術解決數據共享與隱私保護之間的矛盾;通過安全風控和人工智能技術助力海量數據高效分類分級,確保數據安全可控。
這些產品都是對于數據要素密態流通、未來數據要素市場化發展中非常基礎的技術設施,都是在搭建一個最比較底層的東西,相當于是整個數據流轉的技術基礎設施。
澎湃科技:成為一套技術基礎設施的話,要解決哪些問題?
韋韜:第一步要解決技術信任基礎設施的構建問題。然后根據不同的安全等級需求,提供不同層次的可信計算技術,比如單純的可信計算(可信平臺模塊,TPM/TCM),或者是可信計算(TPM/TCM)與機密計算的結合,以及結合了TEE(可信執行環境)和密碼學技術的可信密態計算(TECC)。
可信計算技術可以為技術信任基礎設施提供良好的技術保障。目前有很多云計算服務,但不少云端缺乏可信支撐,用戶對云服務的信任度,還主要取決于對云企業及其運維人員的信任。
如果云端能夠提供符合國家標準的可信計算服務,并且通過可信技術驗證其硬件軟件是否滿足預期,就可以在云端構建一個不依賴于運維人員信任的技術基礎設施。如果有一個可信云或者可信云PaaS(Plantform as a service,平臺即服務)的技術設施,擺脫以前的點對點模式,在這個技術設施上,我們就可以結合各種計算技術,構建可信密態數據節點。各個數據云平臺計算的參與方,可以把自己的數據以密態計算因子的形式參與到這些數據節點的計算中,而且不喪失可控性。所以這需要推動可信技術基礎設施的共建。
“不能既當‘球員’又當‘裁判’”
澎湃科技:數據密態的服務方是否會泄露數據?如何獲得企業信任?
韋韜:相當于例子中的ABC使用共同的一套系統傳輸信息,且系統和傳輸過程全公開、有監控,政府和公眾隨時可以進行監管。
螞蟻作為技術提供方,堅持開源的原則,并不斷將算法開放給行業和社會,邀請大家共同審視我們的數據安全問題。同時,我們也邀請了清華、浙大等國內頂尖的研究機構來驗證我們的算法安全性,并參與了行業標準的測評。我們保證測評所用的算法和實際使用的算法是完全一致的。當然,我們也尊重行業內其他技術方案的選擇,有些創新可能需要閉源的方式進行。但閉源的方式也應該通過行業測評機構或者安全研究機構的認證。
技術角度上,大數據密態化是指各方將自己的明文數據轉化為密態計算因子,在密態樞紐上進行數據計算,既不會泄露原始數據,又能夠充分利用數據的價值。其安全性的保障并不取決于計算在哪個云上進行,而是取決于計算的節點是否可信,是否能夠通過可信計算技術進行驗證。
但與此同時,天下沒有免費的午餐,數據密態,少則增加幾十倍成本,多則幾千倍成本。代價背后是非常復雜的密碼學協議,比如在軟件領域里面,可能錯一個比特,整個安全性就喪失了。
澎湃科技:如何在數據密態的安全性和成本間獲得平衡?
韋韜:國家對數據保護實行的是“分類分級”制度。每個行業都要根據國家制度和行業標準來確定分類分級原則,并對其進行安全保護和監管。
這就意味著我們要根據數據的價值和敏感性來權衡是否使用隱私計算。有些數據雖然需要交易,但并不是很重要,就不一定要用隱私計算。有些數據則是非常重要的,比如個人信息和國家重要數據。可信密態的技術可以把成本控制在行業普惠的水平,中高安全級的成本可以控制在十倍以內,能夠很好的支持行業大規模使用的需求。
總體來看,歷史的機遇、技術的變革,將數據流通推向了前所未有的高潮,也帶來了更加嚴峻的數據安全挑戰。數據流通密態化是未來趨勢,隱私計算的方法體系、平臺框架、技術標準都面臨全新變革。同時,我們也呼吁更多的同行參與到數據密態技術設施建設工作當中,助力全行業數據流轉,邁向“密態天空”。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2024 上海東方報業有限公司