為數據而生,為隱私而戰:隱私計算產業加速崛起
數字經濟時代,數據作為新的生產要素和戰略性資源,是科技進步、政策制定和經濟發展的重要動力。但是,只有在隱私和安全得到保障的前提下,數據的價值才能最大化。
近年來,隨著《網絡安全法》《數據安全法》和《個人信息保護法》的頒布與實施,國家、行業、地方相繼出臺了一系列數據安全相關配套性政策文件,完善數據要素治理制度,保障數據流通交易安全。特別是 2022 年底發布的「數據二十條」,進一步推動了公共數據、企業數據、個人數據合規高效流通使用,數據「可用不可見」「可控可計量」成為法定要求。
在推動數據二十條理念落地的途徑中,隱私計算作為平衡數據流通與價值釋放的關鍵「技術解」,得到了越來越多的重視。在 2022 年 Gartner 技術成熟度曲線列出的 25 項值得關注的新興技術中,有 6 項與隱私計算相關,足見其價值與潛力。

圖片來源:gartner.com
今年 1 月,工信部、國家網信辦、國家發改委等 16 部門印發《關于促進數據安全產業發展的指導意見》,明確提出加強隱私計算、數據流轉分析等關鍵技術攻關,加強數據質量評估、隱私計算等產品研發。
隱私計算產業也在加速崛起。中國信息通信研究院報告指出,預計到 2025 年,中國的隱私計算市場規模將達到百億元人民幣。
隱私計算技術發展情況
隱私計算是隱私保護計算(Privacy-preserving Computation)的簡稱,它能夠在保證數據提供方不泄露原始數據的前提下,對數據進行分析、處理和使用,是一個廣義的概念,涉及人工智能、數據科學等眾多學科和領域的交叉融合,涵蓋了安全多方計算、同態加密、差分隱私、零知識證明、聯邦學習、可信執行環境等眾多技術子項,以及這些技術子項的組合及相關產品方案。
安全多方計算(Secure Multi-Party Computation)
由圖靈獎得主姚期智院士于 1982 年通過提出和解答「百萬富翁問題」而創立。安全多方計算能保證各參與方僅獲得正確計算結果,無法獲得除計算結果之外的任何信息,是多種密碼學基礎工具的綜合應用,除混淆電路、秘密分享、不經意傳輸等密碼學原理構造的經典多方安全計算協議外,其他所有用于實現多方安全計算的密碼學算法(如同態加密、零知識證明),都可以構成多方安全計算協議。經過 30 多年的理論研究,安全多方計算在技術上已趨成熟,在需要識別共同客戶或興趣但又要保護其他數據的場景下,例如醫療領域進行共同研究,或是企業之間分享數據以提高業務效率,已經發揮出重要的應用價值。
機密計算(Confidential Computing)
機密計算的基本原理是將需要保護的數據或代碼存儲在可信執行環境(Trusted Execution Environment,TEE)中,對這些數據和代碼的任何訪問都必須經過基于硬件的訪問控制,防止其在使用中未經授權被訪問或修改,從而實現對數據處理流程的可驗證與控制,增強數據的安全性。其中,可信執行環境定義為可在數據機密性、數據完整性和代碼完整性三方面提供一定保護水平的環境,也包括云環境。機密計算可追溯至 2002 年 ARM 推出 TrustZone 技術,2015 年Intel 推出 SGX 技術標志著機密計算進入快速發展階段,如今 AMD、華為等廠商也推出了各自的機密計算技術。

使用聯邦學習在多個移動端聯合訓練機器學習模型。圖片來源:Wikipedia
聯邦學習(Federated Learning)
聯邦學習由 Google 在 2016 年提出,其核心思想是允許兩個或多個參與方在數據不出域的情況下,協同完成模型的構建與使用,強調「數據不動模型動,數據可用不可見」,適用于參與用戶多、數據特征多且分布廣泛的聯合計算應用場景。根據參與計算的數據在數據方之間分布的情況不同,可以分為橫向聯邦學習、縱向聯邦學習和聯邦遷移學習。通常情況下,聯邦學習需要與其他隱私保護技術聯合使用,才能在計算過程中實現對數據的保護。
中國互聯網巨頭隱私計算產業落地情況
目前,隱私計算正處于飛速發展階段,單點技術持續優化,在實際應用中呈現出多技術融合的態勢,以應對不同場景下的數據安全和隱私保護需求。根據 Gartner《2022 隱私技術成熟度曲線》報告,預計未來 5-10 年隱私計算技術會被大規模商業化應用,到 2025 年 60% 以上的大型組織將在數據分析、商業智能或云計算中使用一種或多種隱私計算技術。
隨著技術增益與商業落地場景逐步豐滿,大數據、人工智能、區塊鏈、云服務等類型的企業紛紛入局隱私計算,各類玩家在積極推高技術滲透率與拓展應用邊界的過程中,一同構成中國隱私計算產業圖景。
其中,騰訊、螞蟻、阿里、百度、字節跳動等互聯網巨頭有強大的技術實力,龐大的用戶群與合作伙伴,坐擁海量高價值數據,是隱私計算入局者中不可忽視的力量。這些企業不僅能推動隱私計算技術加速發展,催生出新的產業機會與發展空間,還有望重塑企業與用戶之間的關系,甚至影響行業力量對比與市場格局。
騰訊
騰訊早在 2009 年便自主研發大數據處理平臺, 2015 年發布高性能計算框架 Angel,支持 10 億維度的算法訓練和非結構化數據處理,被廣泛用于微信支付、QQ、騰訊視頻等業務。為了更好應對數據安全和隱私保護需求,騰訊積極探索隱私計算技術,在 2019 年組建了專門的研發團隊,并發力內部人才培養。2021 年,騰訊第四代大數據平臺「天工」發布,旨在以安全的形式打通數據孤島,打造安全、智能、統一的新型數據基礎設施。其中,隱私計算作為核心技術,確保機器學習和大數據分析在各個場景中落地時調用數據的安全。
天工平臺的核心產品 Angel PowerFL 安全聯合計算平臺,是騰訊聚焦隱私計算前沿技術領域的落地成果,目前已通過中國金融認證中心(CFCA)、中國信通院等權威組織機構評測,在金融、廣告、醫療、政務等場景落地,并取得了較好的應用效果。另一個核心產品騰訊云安全隱私計算平臺,是一個基于聯邦學習、多方安全計算、區塊鏈、TEE 等安全技術的分布式計算平臺,依托 Angel PowerFL 能力支持,圍繞強安全、高性能、強穩定、易使用四大核心能力特性,使原始合作數據不出本地便可實現聯合建模、安全求交(PSI)、隱匿查詢、安全統計分析等功能,助力產品應用層全方位滿足行業需求與用戶的痛點,已實際應用于跨機構數據合作、銀行信貸、保險、政務、在線教育等多個場景。
騰訊 Angel PowerFL 隱私計算團隊也是國內較早開展隱私計算與聯邦學習技術研究和應用的團隊,在大數據、分布式計算、分布式機器學習、分布式消息中間件、多方安全計算、應用密碼學等領域都有豐富的研發和應用經驗,已發表近 10 篇隱私計算研究論文,提交了 60 多件隱私計算技術發明專利申請,有多個商用隱私計算和聯邦學習的平臺產品目前已經通過騰訊云對外開放。團隊連續三年獲得隱私計算業內最具影響力的權威獎項,分別是 2020 年 iDASH 國際隱私計算大賽可信計算賽道冠軍、2021 年 iDASH 聯邦學習賽道冠軍、2022 年 iDASH 同態加密賽道冠軍。
目前,騰訊隱私計算匯聚了來自騰訊大數據、騰訊安全、騰訊計費、騰訊云、騰訊廣告 AI,華中科技大學的密碼學、隱私計算、大數據和機器學習領域的技術專家。通過結合騰訊多元的科技能力,深度融合聯邦學習、安全多方計算、區塊鏈等技術,幫助客戶打破數據孤島,激活數據使用的最大價值。未來將繼續融合隱私計算與云上 AI 安全技術,并與其他企業和機構合作,推動隱私計算更廣泛的落地。
螞蟻
螞蟻集團從 2016 年起布局隱私計算,在技術研發、產品服務、生態共建等方面取得諸多成果。螞蟻擁有業內第一的隱私計算專利數量,并且提出了可信密態計算、受控匿名化等新的技術。產品和服務方面,開源可信隱私計算框架隱語(SecretFlow),支持目前幾乎所有主流的隱私計算技術,并且積極支持互聯互通;開源可信執行環境隱私計算操作系統 Occlum,兼容 Linux 環境的 API,使現有應用幾乎不需改造即可運行于可信執行環境,大幅降低 TEE 應用開發門檻;商用方面,螞蟻隱私計算一體機,提供集軟硬件全棧可信于一體的系統平臺,為組織機構之間的數據聯合計算提供一站式安全解決方案;大規模多方安全計算商用平臺螞蟻鏈摩斯,是業內首家通過多方安全計算產品測評(信通院 MPC 測評)和首批通過金標委 MPC 測評的產品,截止 2022 年 2 月已服務 150 余家行業客戶。生態方面,螞蟻也積極推動國際國內的行業標準制定,是多項重要標準的牽頭機構。
阿里
阿里集團在隱私計算領域廣泛涉足,旗下的阿里安全、阿里云和達摩院均開展相關研究。阿里安全的雙子座實驗室專注于同態加密、安全多方計算等方向,其研發技術已廣泛應用于阿里系業務,部分技術達到業界領先。阿里云在 2020 年首次發布基于芯片安全的可信虛擬化實例,2021 年發布 DataTrust 隱私增強計算平臺,基于同態加密與可信執行環境,在保障數據安全和隱私的同時支持多方數據協同分析與預測,不受數據規模或復雜性影響,是國內首個公有云原生加密計算產品。達摩院在 2022 年發布了 FederatedScope 聯邦學習框架并開源,支持在豐富應用場景中進行大規模、高效率的聯邦學習異步訓練,能兼容 PyTorch、Tensorflow 等不同設備運行環境,大幅降低了聯邦學習在科研與實際應用中的開發難度和成本。
百度
百度 2012 年便發布《數據安全策略》,2018 年成立數據隱私保護委員會,目前隱私計算作為底層基礎技術,在百度智能云、百度安全、百度超級鏈等平臺上部署,并結合多種技術推出解決方案實現應用落地。百度智能云還與區塊鏈平臺融合,通過將區塊鏈技術納入云計算與隱私計算的過程,推動隱私計算在各種場景中落地。百度大腦旗下的大數據服務平臺百度點石,基于聯邦學習、多方安全計算、可信執行環境等主流隱私計算技術,安全高效實現數據賦能,助力客戶提升數據價值。百度點石安全計算平臺(MesaTEE)是百度安全在隱私計算面向企業落地的重要平臺。基于百度飛槳開發的開源聯邦學習框架 PaddleFL,讓企業之間的合作能夠在數據層面安全開展。PaddleFL 提供多種聯邦學習策略及其在計算機視覺、自然語言處理、推薦算法等領域的應用。
字節跳動
字節跳動在隱私計算領域布局較為集中,最主要的產品是 Fedlearner 聯邦學習平臺。該項目于 2019 年啟動,最初是針對單個企業進行定制化適配,基于神經網絡縱向聯邦學習技術,幫助企業提高廣告投放效率,后續通過迭代,逐步在電商、互聯網金融和教育領域落地。2020 年,Fedlearner 開源,支持多類聯邦學習模式,整個系統包括控制臺、訓練器、數據處理、數據存儲等模塊,各模塊對稱部署在參與聯邦的雙方集群上,透過代理互相通信實現訓練。字節跳動作為隱私計算聯盟(CCC)成員之一,也參與推動隱私計算市場的發展,影響技術和法規標準,協助提高下一代互聯網的計算信任度和安全性。
結語
隨著數據安全合規流通成為必然,隱私計算作為當下實現數據「可用不可見」的唯一技術解,對未來的科技產業以及實體經濟的關鍵領域將產生重要影響。除了典型的金融、醫療等場景,隱私計算也被探索用于越來越多的行業與領域。
例如,電力公司通過隱私計算,可實現對電網數據的全生命周期進行保護,使得數據能夠安全上云,或外包給計算服務方進行計算,實現電力企業的降本增效。廣告平臺使用隱私計算對用戶數據進行加密,讓原始數據不可識別,從而在不揭示個人信息的前提下完成廣告定向和個性化推薦,運用聯邦學習等技術,可以在不共享原始用戶數據的前提下多方共同訓練一個機器學習模型,還能在用戶終端內完成個性化推薦,確保推薦效果的同時最大限度保護用戶隱私。未來,創新的隱私保護方案,包括用于移動設備的可信執行環境,能在移動個性化推薦服務中實現令人滿意的用戶體驗并保護用戶隱私,真正實現雙贏。出行領域,隱私計算使運營商與服務提供商可在加密狀態下使用線上數據,對城市交通狀況與出行需求進行分析與預測,為交通調度與新業務創新提供基礎,同時保護用戶隱私和數據安全。
我們已經看到,充分釋放數據的價值能夠推動革命性的創新,試想一個個比 ChatGPT 更加智能的產品進入生活,了解我們的興趣與習慣,提供定制化服務,讓工作和生活變得前所未有的便利與個性化。在這一過程中,隱私計算將作為新技術應用中不可或缺的一部分,讓數據在創造價值的同時保持安全可控,守護人們對隱私保護的合理預期。





















